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本 书 适 合 学 习 Python3 的 人 门 读者 ,也 适用 对 编程 一 无 所 知 ,但 渴望 用 编程 改变 世界 的 朋友 们 ! 本 书 提 
倡 理解 为 主 , 应 用 为 王 。 因 此 ,只 要 有 可 能 ,小 甲鱼 (作者 ) 都 会 通过 生动 的 实例 来 让 大 家 理解 概念 。 

虽然 这 是 一 本 入 门 书籍 ,但 本 书 的 “野心 ”可 并 不 止 于 “初级 水 平 ” 的 教学 。 本 书 前 半 部 分 是 基础 的 语法 
特性 讲解 ,后 半 部 分 围绕 着 Python3 在 爬虫 .Tkinter 和 游戏 开发 等 实例 上 的 应 用 。 

编程 知识 深 似 海 ,小 甲鱼 没 办 法 仅 通过 一 本 书 将 所 有 的 知识 都 灌输 给 你 ,但 能 够 做 到 的 是 培养 你 对 编程 
的 兴趣 ,提高 你 编写 代码 的 水 平 ,以 及 锻炼 你 的 自学 能 力 。 最 后 ,本 书 贯彻 的 核心 理念 是 : 实用 好玩, 还 有 参 
与 。 微 信 扫 描 书 中 对 应 二 维 码 , 亦 可 观看 相关 视频 。 
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Life is short. You need Python. 


Bruce Eckel 


上 边 这 句 话 是 Python 社区 的 名 言 ,翻译 过 来 就 是 人 生 苦 短 ,我 用 Python", 

我 和 Python 结缘 于 一 次 服务 器 的 调试 ,从 此 便 一 发 不 可 收拾 。 我 从 来 没有 遇 到 一 门 编 
程 语 言 可 以 如 此 干净 简洁, 如果 你 有 处 女 座 情节 ,你 一 定 会 爱 上 这 门 语 言 。 使 用 Python ,可 
以 说 是 很 难 写 出 丑陋 的 代码 。 我 从 来 没 想 过 一 门 编程 语言 可 以 如 此 简单 , 它 太 适合 零 基 础 的 
朋友 踏 入 编程 的 大 门 了 ,如 果 我 有 一 个 八 岁 的 孩子 ,我 一 定 会 毫 不 犹 殉 地 使 用 Python 引导 他 
学 习 编程 ,因为 面 对 它 ,永远 不 缺乏 乐趣 。 

Python 虽然 简单 ,其 设计 却 十 分 严 说。 尽管 Python 可 能 没有 C 或 C++ 这 类 编译 型 语言 
运行 速度 那么 快 ,但 是 C 和 C++ 需要 你 无 时 无 刻 地 关注 数据 类 型 .内存 洪 出 ,边界 检查 等 问 
题 。 而 Python, 它 就 像 一 个 贴心 的 仆人 , 私 底下 为 你 都 一 一 处 理 好 ,从 来 不 用 你 操心 这 些 ,这 
让 你 可 以 将 全 部 心思 放 在 程序 的 设计 逻辑 之 上 。 

有 人 说 ,完成 相同 的 一 个 任务 ,使 用 汇编 语言 需要 1000 行 代码 ,使 用 C 语言 需要 500 fT. 
使 用 Java 只 需要 100 行 , 而 使 用 Python ,可 能 只 要 20 行 就 可 以 了 。 这 就 是 Python, 使 用 它 来 
编程 ,你 可 以 节约 大 量 编写 代码 的 时 间 。 

既然 Python 如 此 简单 ,会 不 会 学 了 之 后 没什么 实际 作用 呢 ? 事实 上 你 并 不 用 担心 这 个 
问题 ,因为 Python 可 以 说 是 一 门 “万 金 油 ”语言 ,在 Web 应 用 开发 、 系统 网 络 运 维 、 科 学 与 数字 
计算 、3D 游戏 开发 .图 形 界 面 开 发 、 网 络 编程 中 都 有 它 的 身影 。 目 前 越 来 越 多 的 IT 企业 ,在 招 
聘 栏 中 都 有 “精通 Python 语言 优先 考虑 ”的 字样 。 另 外 ,就 连 Google 都 在 大 规模 使 用 


Python, 
Af Y dE ADOBE A ITI du De L i] Jc Ii zz f X K oe e «Jp V e USC C TT AE s E P ES RC ER A 
家 上 自己 体验 吧 , 


接 下 来 简单 地 介绍 一 下 这 本 书 。 一 年 前 ,出 版 社 的 编辑 老师 无 意 间 看 到 了 我 的 一 个 同名 
的 教学 视频 ,建议 我 以 类 似 的 风格 撰写 一 本 书 。 当 时 我 是 受 宠 奉 惊 的 ,也 很 兴奋 。 刚 开始 写作 
就 遇 到 了 不 小 的 困难 一 一 如 何 将 视频 中 口语 化 的 描述 转变 为 文字 。 当 然 , 我 希望 尽 可 能 地 保 
留 原 有 的 幽默 和 风趣 一 一 毕竟 学 习 是 要 快乐 的 。 这 确实 需要 花 不 少时 间 去 修改 ,但 我 觉得 这 
是 值得 的 。 

本 书 不 假设 你 拥有 任何 一 方面 的 编程 基础 ,所 以 本 书 不 但 适合 有 一 定编 程 基础 , 想 学 习 
Python3 的 读者 ,也 适合 此 前 对 编程 一 无 所 知 , 但 淘 望 用 编程 改变 世界 的 朋友 ! 本 书 提 倡 理解 
为 主 ,应 用 为 王 。 因 此 ,只 要 有 可 能 ,我 都 会 通过 生动 的 实例 来 让 大 家 理解 概念 。 虽 然 这 是 一 
本 入 门 书籍 ,但 本 书 的 “野心 ”可 并 不 止 于 “初级 水 平 ” 的 教学 。 本 书 前 半 部 分 是 基础 的 语法 特 
性 讲解 ,后 半 部 分 围绕 着 Python3 EEH Tkinter 和 游戏 开发 等 实例 上 的 应 用 。 编 程 知 识 深 
似 海 , 没 办 法 仅 通 过 一 本 书 将 所 有 的 知识 都 灌输 给 你 ,但 我 能 够 做 到 的 是 培养 你 对 编程 的 兴 
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趣 ,提高 你 编写 代码 的 水 平 , 以 及 银 炼 你 的 目 学 能 力 。 最 后 ,本 书 贯 彻 的 核心 理念 是 : 实用 、 好 
玩 , 还 有 参与 。 
本 书 对 应 的 系列 视频 教程 ,可 以 在 http://blog. fishc. com/category/python 下 载 得 到 ,也 
可 扫描 以 下 二 维 码 关注 微 信 号 进行 观看 。 


微 信和 扫描 书 中 对 应 二 维 码 , 亦 可 观看 相关 视频 。 
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4.1 获得 Python 


我 观察 到 这 么 一 个 现象 : 很 多 初学 的 朋友 都 会 在 学 习 论 坛 上 问 什 么 语言 才 是 最 好 
的 ?他们 的 目的 很 明确 ,就 是 要 找 一 门 “ 最 好 ”的 编程 语言 ,然后 持之以恒 地 学 习 下 去 。 
没 错 , 这 种 “ 执 子 之 手 ,与 子 倘 老 ”的 专 一 精神 是 我 们 现实 社会 所 推 尝 的 。 但 在 编程 的 世 
界 里 ,我们 并 不 提倡 这 样 。 我 们 更 提倡 “存在 即 合理 ”, 当 前 热门 的 编程 语言 都 有 其 存在 
的 道理 ,它们 都 有 各 日 擅长 的 领域 和 适用 性 。 因 此 我 们 没 办 法 去 衡量 哪 一 门 语 言 才 是 最 
好 的 。 

Python 的 语法 是 非常 精简 的 ,对 于 一 位 完美 主义 者 来 说 ,Python 将 是 他 爱不释手 的 伙 
fF, Python 社区 的 目标 就 是 构造 完美 的 Python 语言 ! 本 书 将 使 用 Python3 来 进行 讲解 ,而 
Python3 不 完全 兼容 Python2 的 语法 ,这 样 做 无 疑 会 让 大 多 数 程序 员 心 生 怨 导 且 哗 唆 不 休 , 因 
为 他 们 用 Python2 写 的 大 量 代 码 经 过 层 层 调试 已 经 趋 近 完 美 ,并 已 部 署 到 服务 表 或 应 用 上 
了 。Python3 对 Python2 的 语法 不 兼容 ,意味 着 他 们 的 这 些 应 用 需要 进行 转换 和 重新 调 
jv 但 是 ,Python 社区 仍旧 坚持 推出 全 新 的 Python3, RA 93 He] E- HB] FRA Re APR TH T 
I E JE DAY o A Be ad ies h ECIE B o6 2 HIS Us ! 

LAGE HC SR VAH SE. RIERA KRKE”, ZH Python 去 拯救 世界 ,要 做 的 第 一 件 
事 就 是 要 下 载 一 个 Python IJ Ze FT HRD R E EORESUWRBITETESLE:. 

dC Python 非常 容易 ,你 可 以 在 它 的 官网 找到 最 新 的 版 本 并 下 载 ( 注 : 本 书 所 需要 的 程 
F ,例子 均 附 市 在 本 书 配套 资源 中 ) ,地址 是 http://www. python. org. 

如 图 1-1 所 示 , 进 入 Python 官网 后 找到 Download 字样 ,下 载 最 新 版 本 的 Python 即 可 。 

如 果 是 其 他 操作 系统 (例如 ,Mac OS X) ,在 页 面 下 方 可 以 找到 对 应 的 下 载 地 址 ,如 图 1-2 
所 示 。 

此 处 演示 的 是 本 书 截 稿 前 的 最 新 版 本 Python 3. 4. 3(32 位 )( 注 : 这 里 建议 大 家 安装 32 
位 版 ,因为 本 书 第 16 2€ Z7 Pygame 时 需要 32 位 版 本 的 Python) ,一 般 大 家 下 载 最 新 版 本 即 
可 。 安 装 Python3 非 稼 简单 ,打开 下 载 好 的 安装 包 ,按照 默认 选项 安装 即 可 。 
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图 1-1 下 载 Python3 
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图 1-2 下载 Python3 


4.2 M IDLE 启动 Python 


IDLE 是 一 个 Python Shell ,shell 的 意思 就 是 “外 元 ”, 从 基本 上 说 ,就 是 一 个 通过 输入 文 
本 与 程序 交互 的 途径 。 像 Windows 的 cmd 窗口 , 像 Linux 那个 黑 和 平平 的 命令 窗口 ,它们 都 是 
shell, 利 用 它们 ,就 可 以 给 操作 系统 下 达 命 令 。 同 样 ,可 以 利用 IDLE 这 个 shell 与 Python 进 


gla ”就 这 么 愉快 地 开始 吧 M 
行 互动 。 
二 二 二 这 个 提示 符 含义 是 : Python 已 经 准备 好 了 ,在 等 着 输入 Python 指令 呢 。 如 图 1-3 
所 示 ,可 以 看 到 Python 已 经 按照 我 们 的 要 求 去 做 了 ,在 屏幕 上 打印 ( 注 : 这 里 打印 的 意思 是 
“打印 ?到 屏幕 上 )I love fishc. com 这 个 充满 浓 浓 爱 意 的 字符 串 , 这 说 明 什么 ” 没 错 , 这 说 明 我 
们 是 “ 爱 鱼 C” 的 ,也 说 明了 我 们 跟 Python 的 第 一 次 亲密 接触 是 有 感觉 的 ,她 完全 能 够 理解 我 
的 想法 。 


E *Python 3.4.3 Shell* 
File Edit Shell Debug Options Window Help 
Python 3.4.3 (v3.4.3:9b73f1c3e601, Feb 24 2015, 22:43:06) [MSC v.1688 32 bit (In 加 | 


tel)] on win32 

Type "copyright", "credits" or "license()" for more information. 
»»» print("I love FishC.com!") 

I love FishC.com! 

>>> 


图 1-3 在 Python 的 IDLE 中 输入 命令 


4.3 失败 的 尝试 
- 


像 下 面 这样 输 入 ,Python Sb" AE ABT Hd 


>>> print "I love fishc.com" # 这 是 Python2.x 的 语法 
SyntaxError: Missing parentheses in call to 'print' 
>>> printf("I love fishc.com"); # 这 是 C 语 言 的 语法 
Traceback (most recent call last): 
File "<pyshell#1>", line 1, in < module» 
printf("I love fishc. com"); 
NameError: name 'printf' is not defined 


其 实 Python3 Bf Hi f * AE", db HL IgA C. BEDA SERERE SEWER. RAD De UT Sub TE DEL: 为 


儿 比 我 好 ,她 还 要 加 分 号 呢 ,我 可 不 用 ! 
大 家 看 到 上 边 的 代码 中 井 号 (# ) 后 边 加 了 段 中 文 , 井 号 起 到 的 作用 是 注释 ,也 就 是 说 , 井 
号 后 边 的 内 容 是 给 人 们 看 的 ,并 不 会 被 当 作 代码 运行 。 


1.4 ”尝试 点 儿 新 的 东西 
Wu» 


尝试 点 儿 新 的 东西 ,在 IDLE 中 输入 print(5 十 3) 或 者 直接 输入 5+3: 


>>> print(5 + 3) 
8 

>>> 5+3 

8 


看 起 来 Python 还 会 做 加 法 ! 这 并 不 奇怪 ,因为 计算 机 最 开始 的 时 候 就 是 用 来 计算 的 , 任 
何 编程 语言 都 具备 计算 能 力 , 那 接 下 来 看 看 Python 在 计算 方面 有 何 神奇 。 


«|| 零 基础 入 门 学 习 Python 
不 妨 再 试 试 计算 1234567890987654321 * 9876543210123456789 : 


>>> 1234567890987654321 * 9876543210123456789 
12193263121170553265523548251112635269 


怎么 样 ? 如 果 C 语言 实现 起 来 费劲 ,要 九 曲 十 八 弯 地 利用 数组 做 大 数 运 算 , 在 这 里 
Python 轻而易举 就 完成 了 ! 
还 有 了 呢 ,大 家 试 试 输入 print("Well water " 十 "River"): 


>>> print("Well water " + "River") 


Well water River 


可 以 看 到 , 井 水 和 河水 又 友好 地 在 一 起 生活 了 mL TT OE dO! 
4.5 为 什么 会 这 样 


再 试 试 print("I love python\n" * 3) : 


>>> print("I love pythonin" * 3) 
I love python 
I love python 
I love python 


IE ,字符 串 和 数字 还 可 以 做 乘法 ,结果 是 重复 显示 N 个 字符 串 。 既 然 乘法 可 以 , 那 不 妨 试 
试 加 法 。print("I love python\n" + 3): 


>>> print("I love pythonMn" + 3) 
Traceback (most recent call last): 
File "< pyshell # 8>", line 1, in «module» 
print("I love python\n" + 3) 
TypeError: Can't convert 'int'object to str implicitly 


失败 了 ! 这 是 为 什么 呢 ? 大 家 不 妨 课 后 目 己 思考 一 下 。 


2.1 第 一 个 小 游戏 cB 
— mj : : 
有 读者 可 能 会 说 :“ 哇 ,小 甲鱼 ( 注 ; 作者 )! 你 开玩笑 呢 ? 这 么 快 就 教 我 们 开发 游戏 啦 ? 


难道 你 不 打算 先 讲 讲 变 量 、 分 支 、 循 环 、 条 件 、 函 数 等 常规 的 内 容 ?” 

没 馈 的 ,大 家 如 有 果 继 续 学 下 去 就 会 发 现 , 本 书 的 教学 会 围绕 看 一 个 个 个 性 鲜明 的 实例 来 展 
开 , 跟 着 本 书 完 成 这 些 实 例 的 编写 ,你 会 发 觉 不 知 不 觉 中 那些 该 擎 握 的 知识 ,已 经 化 作 你 身体 
的 一 部 分 了 ! 这 样 的 学 习 方 式 才 能 充满 快乐 并 让 你 一 直 期 竺 下 一 章节 的 到 来 。 

好 ,今天 来 讲 一 下 “植物 大 战 僵尸 ”这 球 游 戏 的 编写 …… 但 这 是 不 可 能 的 ,因为 虽然 说 
Python 容易 入 门 ,但 像 “ 植 物 大 战 僵 尸 "? 这 类 游戏 要 涉及 碰撞 检测 .边缘 检查 .画面 刷新 和 音效 
等 知识 点 比较 多 ,需要 将 这 些 基 础 知识 累积 完成 才能 开始 讲 。 

目前 对 于 我 们 所 掌握 的 基础 …… 和 貌似 只 有 print() 这 个 BIF , 哦 ,BIF 的 概念 甚至 还 没 讲 
解 …… 不 过 请 淡定 ,这 一 点 儿 也 不 影响 我 们 今天 的 节奏 1 

那么 今天 是 一 个 什么 样 的 节奏 呢 ? 今天 打算 讲 一 个 文字 游戏 …… 

先 来 看 下 这 段 代 人 码 , 并 试图 猜测 一 下 每 条 语句 的 作用 : 

# p2_1.py 

""" -第 一 个 小 游戏 --- 0" 

temp = input(" 不 妨 猜 一 下 小 甲鱼 现在 心里 想 的 是 哪个 数字 :") 

guess = int(temp) 

if guess == 8: 

print(" 你 是 小 甲鱼 心里 的 映 虫 吗 ?!") 
print(" 哼 , 猜 中 了 也 没有 奖励 !") 


else: 
print(" 猜 错 啦 , 小 甲鱼 现在 心里 想 的 是 81") 
print(" 游 戏 结束 ,不 玩 啦 ^“") 
在 这 里 要 求 大 家 都 动 动手 ,亲自 输入 这 些 代 码 , 你 需要 做 的 是 : 
。 打开 IDLE。 
。 选择 File- 二 New Window 命令 (或 者 你 可 以 直接 按 Ctrl 十 N 键 ,在 很 多 地 方 这 个 快捷 
键 都 是 新 建 一 个 文件 的 意思 ) 。 
。 按照 上 边 的 格式 填 人 代码 。 
。 按 快 捷 键 Ctrl 十 S ,将 源 代 码 保存 为 名 为 p2_1. py 的 文件 。 
。 输 完 代码 一 起 来 体验 一 下 ,F5 走 起 (也 可 以 选择 Run Run Module 命令 )! 
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程序 执行 结果 如 下 : 


>>> 

不 妨 猜 一 下 小 甲鱼 现在 心里 想 的 是 哪个 数字 : 5 
猜 错 啦 , 小 甲鱼 现在 心里 想 的 是 8! 
游戏 结束 ,不 玩 啦 ^_^ 
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diit 
Tab 按键 的 使 用 ; 
(1) 缩 进 。 


(2) IDLE 会 提供 一 些 建议 ,例如 输入 pr TAB 会 显示 所 有 可 能 的 命令 供 你 参考 。 


OK ,我 们 是 看 到 程序 成 功 跑 起 来 了 ,但 坦 日 说 ,这 玩意 儿 配 叫 洲 戏 吗 ? WE eee e E i, 
慢 慢 改进 ,好 ,我 们 说 下 语法 。 

有 C-like 语言 (一 切 语 法 类 似 C 语言 的 编程 语言 称 为 C-like 语言 ) 编 程 经 验 的 朋友 可 能 
会 受 不 了 ,变量 呢 ? 声明 呢 ? 怎么 直接 就 给 变量 定义 了 呢 ! 有 些 其 正 零 基础 的 谈 者 可 能 还 不 
AI fT 4 Ji AE RE ART , 随 春 本 书 内 容 的 展开 ,大 家 很 快 就 能 掌握 相关 的 知识 。 有 些 谈 者 可 能 
发 现 这 个 小 程序 没有 任何 大 括号 ,好 多 编程 语言 都 用 大 括号 来 表示 循环 、 条 件 等 的 作用 域 ,而 
在 Python 这 里 是 没有 的 。 在 Python 中 ,只 需要 用 适当 缩 进来 表示 即 可 。 


2.2 Hii 


缩 进 是 Python 的 灵魂 , 缩 进 的 严格 要 求 使 得 Python 的 代码 显得 非常 精简 并 且 有 层次 。 
但 是 ,在 Python 里 对 待 代码 的 缩 进 要 十 分 小 心 , 因 为 如 果 没 有 正确 地 使 用 缩 进 ,代码 所 做 的 
事情 可 能 和 你 的 期 望 相差 其 远 ( 就 像 在 C 语言 里 括号 打 销 了 位 置 )。 

如 果 在 正确 的 位 置 输入 冒号 (:),IDLE 会 在 下 一 行 自 动 进行 缩 进 。 正 如 方才 的 代码 ,在 if 
和 else 语句 后 边 加 上 冒号 (:), 然 后 按 下 回 车 ,第 二 行 开始 的 代码 会 自动 进行 缩 进 。if 条 件 下 
边 有 两 个 语句 分 别 有 缩 进 ,那么 说 明 这 两 个 语句 是 属于 if 条件 成 立 后 所 需要 执行 的 语句 , 换 
句 话 说 ,如 果 过 条 件 不 成 立 ,那么 两 个 缩 进 的 语句 就 不 会 被 执行 。 


pn 
if…else… 是 一 个 条 件 分 支 , if 后 边 跟 的 是 条 件 , 如 果 条 件 成 立 , 就 执行 以 下 缩 进 的 所 
有 内 容 ; 如 果 条 件 不 成 立 , 有 else 的话 就 执行 else 下 缩 进 的 所 有 内 容 。 条 件 分 支 的 内 容 在 


后 边 还 会 做 详细 的 介绍 。 


2.3 BIF 


接 下 来 学 习 一 个 新 的 名 词 : BIF。 
BIF 就 是 Built-in Functions, A E KRAKU, f FA AE EE PR ET 为 了 方便 程序 员 快 
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速 编写 脚本 程序 (脚本 就 是 要 代码 编写 速度 快 快 快 1) ,Python 提供 了 非常 丰 定 的 内 置 函 数 , 只 
需要 直接 调用 即 可 ,例如 printO) 是 一 个 内 置 函数 , 它 的 功能 是 “打印 到 屏幕 ”, 就 是 说 把 括号 里 
的 内 容 显示 到 屏幕 上 。inputO) 也 是 一 个 BIF, 它 的 作用 是 接收 用 户 输入 并 将 其 返回 ,在 上 方 
的 代码 中 ,用 temp 这 个 变量 来 接收 。Python 的 变量 是 不 需要 事先 声明 的 ,直接 给 一 个 合法 的 
名 字 赋 值 , 这 个 变量 就 生成 了 。 


二 提示 


在 IDLE 中 输入 dir(C builtins ) 可 以 看 到 Python 提供 的 内 置 函 数列 表 。 


help() 这 个 BIF 用 于 显示 BIF 的 功能 描述 : 


>>> help(print) 
Help on built - in function print in module builtins: 


print(...) 
print(value, ..., sep- '', end- '\n', file- sys. stdout, flush = False) 


Prints the values to a stream, or to sys.stdout by default. 

Optional keyword arguments: 

file: a file- like object (stream); defaults to the current sys. stdout. 
sep: string inserted between values, default a space. 

end: string appended after the last value, default a newline. 

flush: whether to forcibly flush the stream. 


有 些 谈 者 可 能 会 说 , 太 多 BIF 学 不 过 来 记 不 过 来 怎么 办 ? UTE XX DH) A JN? 
Python3 的 资料 太 少 怎么 办 ?大 家 不 用 担心 ,在 接 下 来 的 每 一 个 环节 ,作者 都 会 教 大 家 几 个 常 
用 的 BIF 的 用 法 ,然后 在 课 后 作业 ( 注 : 每 节 课 对 应 的 课 后 作业 需要 在 鱼 C 论坛 完成 : http:// 
bbs. fishc. com/forum-243-1. html) 中 强化 大 家 的 记忆 。 所 以 ,大 家 只 要 严格 跟着 作者 的 脚步 
走 , 课 后 练习 坚持 自己 独立 完成 ,相信 即使 觉得 自己 记性 很 差 的 朋友 ,也 可 以 做 到 倒 背 如 流 ! 


成 为 高 手 前 必须 知道 的 
一 些 基 础 知识 | 


3.1 变量 


— 


在 改进 小 游戏 之 前 ,有 些 必须 掌握 的 知识 需要 来 讲解 一 下 。 

当 你 把 一 个 值 赋值 给 一 个 名 字 时 , 它 会 存储 在 内 存 中 ,把 这 块 内 存 称 为 变量 (variable) 。 
在 大 多 数 语 言 中 ,都 把 这 种 行为 称 为 “给 变量 赋值 ”或 “把 值 存储 在 变量 中 ”。 

不 过 ,Python 与 大 多 数 其 他 计算 机 语言 的 做 法 稍 有 不 同 , 它 并 不 是 把 值 存储 在 变量 中 ,而 
更 像 是 把 名 字 “ 贴 ”在 值 的 上 上边。 所 以 有 些 Python 程序 员 会 说 Python 没有 变量 ,只 有 名 字 。 
变量 就 是 一 个 名 字 ,通过 这 个 名 字 ,可 以 找到 我 们 想到 的 东西 。 

看 个 例子 : 

>>> teacher = "小 甲鱼 " 

>>> print(teacher) 

小 甲鱼 

>>> teacher = "XH fü" 


>>> print(teacher) 


老 甲 鱼 
变量 为 什么 不 叫 “ 恒 量 ” 而 叫 变 量 ? 正 是 因为 它 是 可 变 的 ! 再 看 男 一 个 例子 : 


>>>X= 3 
>>>X = 5 
>>>y = 8 
>>>2= Xt y 


>>> print(z) 

13 

上 面 的 例子 先 创 建 一 个 变量 ,名字 叫 x, 给 它 初始 化 赋值 为 3, 然 后 又 给 它 赋 值 为 5( 此 时 3 
就 被 5 替换 掉 ) , 接 下 来 创建 另外 一 个 变量 y, 并 初始 化 赋值 为 8, 最 后 创建 第 三 个 变量 z, 它 的 
值 是 变量 x 和 y 的 和 。 

同样 的 方式 也 可 以 运用 到 字符 串 中 : 

>>> myteacher = "小 甲鱼 " 


>>> yourteacher = " 老 甲 鱼 " 
>>> ourteacher = myteacher + yourteacher 


SO 成 为 高 手 前 必须 知道 的 一 些 基础 知识 | 


>>> print(ourteacher) 


小 甲鱼 老 甲 鱼 
这 种 字符 串 加 字符 串 的 语法 ,在 Python 里 称 为 字符 串 的 拼接 。 
需要 注意 的 地 方 : 


。 在 使 用 变量 之 前 ,需要 对 其 先 赋值 。 

。 变量 名 可 以 包括 字母 数字、 下 划 线 ,但 变量 名 不 能 以 数字 开头 ,这 跟 大 多 数 高 级 语言 
一 样 一 一 受 C 语言 影响 ,或 者 说 Python 这 门 语言 本 身 就 是 由 C 语言 写 出 来 的 。 

。 字母 可 以 是 大 写 或 小 写 ,但 大 小 写 是 不 同 的 。 也 就 是 说 ,fishc 和 FishC xf T Python 来 
说 是 完全 不 同 的 两 个 名 字 。 

。 等 号 (二 ) 是 赋值 的 意思 ,左边 是 名 字 ,右边 是 值 ,不 可 写 反 了 。 

。 变量 的 命名 理论 上 可 以 取 任 何 合法 的 名 字 , 但 作为 一 个 优秀 的 程序 员 ,请 尽量 给 变量 
取 一 个 专业 一 点 儿 的 名 字 。 


8.2 - II. 


到 目前 为 止 ,我 们 所 认 知 的 字符 串 就 是 引号 内 的 一 切 东 西 ,我 们 也 把 字符 串 叫 作文 本 , 文 
本 和 数字 是 截然 不 同 的 。 
如 果 直 接 让 两 个 数字 相 加 ,那么 Python 会 直接 将 数字 相 加 后 的 结果 告诉 你 : 


>>>5+8 
13 


但 是 如 采 在 数字 的 两 边 是 加 上 了 引号 ,就 变 成 了 字符 串 的 拼接 ,这 正 是 引号 市 来 的 差别 : 


>>> de du 一 "ut 


— 
要 告诉 Python 你 在 创建 一 个 字符 串 ,就 要 在 字符 两 边 加 上 引号 ,可 以 是 单 引号 或 者 双 引 
号 ,Python 表示 在 这 一 点 上 不 挑 易 。 但 必须 成 对 ,你 不 能 一 边 用 单 引 号 , 另 一 边 却 花心 地 用 上 


双 引号 结尾 ,这 样 Python 就 不 知道 你 到 底 想 干 嘛 了 : 


>>> 'Python I love you!" 
SyntaxError: EOL while scanning string literal 


这 就 有 点 像 你 一 边 跟 Python 说 我 爱 你 ,一 边 却 搂 着 小 C, 所 以 , 面 对 这 么 完美 的 语言 ,我 
们 不 写 别 扭 的 语法 ! 

屠 如 果 字 符 串 内 容 中 需要 出 现 单 引 号 或 双 引 号 怎么 办 ? 

>>> 'Let's go' 

SyntaxError: invalid syntax 

像 上 边 这 样 写 Python 会 误会 你 的 意思 ,从 而 产生 错误 。 

有 两 种 方法 。 第 一 种 比较 常用 ,就 是 使 用 转 义 符号 改 ) 对 字符 串 中 的 引号 进行 转 义 : 


>>> 'Let\'s go' 
"Let's go" 
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还 有 一 种 方法 就 是 利用 Python 既 可 以 用 单 引 号 也 可 以 用 双 引 号 表示 字符 串 这 一 特点 ， 
只 要 用 上 不 同 的 引号 表示 字符 串 ,那么 Python 就 不 会 误解 你 的 意思 啦 。 


>>> "Let's go" 
"Let's go" 


3.3 原始 字符 串 
< 


>>> string = 'C:\now' 

>>> string 

'C:\now' 

>>> print(string) 

C: 

打印 结 采 并 不 是 我 们 预期 的 ,原因 是 反 斜 枉 (\) 和 后 边 的 字符 Cn) 恰 好 转 义 之 后 构成 了 换 
行 符 (\n)。 这 时 候 有 朋友 可 能 会 说 :“ 用 反 斜 杠 来 转 义 反 斜 杠 不 就 可 以 啦 ?” 咽 ,不 错 ,可 以 用 
反 斜 杠 对 目 身 进行 转 义 : 

>>> string = 'C:\\now' 

>>> String 

'C:N\Nnow' 


>>> print(string) 
C:Mnow 


但 如 果 对 于 一 个 字符 串 中 有 很 多 个 反 斜 杠 , 我 们 就 不 乐意 了 。 上 毕竟 ,这 不 仅 是 一 个 将 差 
事 ,还 可 能 使 代码 变 得 混乱 。 

不 过 大 家 也 不 用 怕 , 因 为 在 Python 中 有 一 个 快捷 的 方法 ,就 是 使 用 原始 字符 串 。 原 始 字 
符 串 的 使 用 非常 简单 ,只 需要 在 字符 串 前 边 加 一 个 英文 字母 r 即 可 : 

>>> string = r'C:Mnow' 

>>> String 

'C:\\now' 

>>> print(string) 


C:\now 

在 使 用 字符 串 时 需要 注意 的 一 点 是 : 无 论 是 否 原 始 字符 串 , 都 不 能 以 反 矢 枉 作 为 结尾 
(E: 反 斜 杠 放 在 字符 串 的 末尾 表示 该 字符 串 还 没有 结束 ,换行 继续 的 意思 ,下 一 节 会 讲 这 个 
内 容 ) 。 如 有 果 你 坚持 这 样 做 就 会 报错 : 

>>> string = 'FishCV' 

SyntaxError: EOL while scanning string literal 


>>> string = r'FishC\' 
SyntaxError: EOL while scanning string literal 


大 家 不 妨 考虑 一 下 : 如 有 果 非 要 在 字符 串 的 结尾 加 个 反 和 斜 杠 , 有 什么 办 法 可 以 灵活 实现 吗 ? 


。 ]O 。 
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8.4 Kcd 


如 果 和 希望 得 到 一 个 跨越 多 行 的 字符 串 ,例如 : 
从 明天 起 ,做 一 个 幸福 的 人 

喂 马 ,劈柴 ,周游 世界 

从 明天 起 ,关心 粮食 和 蔬菜 

我 有 一 所 房子 , 面 朝 大 海 , 春 暖 花 开 


从 明天 起 ,和 每 一 个 亲人 通信 
告诉 他 们 我 的 幸福 

那 幸 福 的 闪电 告诉 我 的 

我 将 告诉 每 一 个 人 


给 每 一 条 河 每 一 座 山 取 一 个 温暖 的 名 字 

陌生 人 ,我 也 为 你 祝福 

愿 你 有 一 个 灿烂 的 前 程 

愿 你 有 情人 终 成 眷属 

愿 你 在 尘世 获得 幸福 

我 只 愿 面 朝 大 海 ,春暖 花 开 

咽 ,看 得 出 这 是 一 首 非常 有 文采 的 诗 , 那 如 果 要 把 这 首 诗 打印 出 来 ,用 学 过 的 知识 ,就 不 得 
不 使 用 多 个 换行 符 : 


>>> print(" 从 明天 起 ,做 一 个 幸福 的 人 \n ELS, BEAR, 周游 世界 \n 从 明天 起 , 关心 粮食 和 蔬菜 \n 我 有 
一 所 房子 , HHK, 春暖 花 开 \n\n 从 明天 起 ， 和 每 一 个 亲人 通信 \n 告诉 他 们 我 的 幸福 \n 那 幸 福 的 内 
电 告 诉 我 的 \n 我 将 告诉 每 一 个 人 \n\n 给 每 一 条 河 每 一 座 山 取 一 个 温暖 的 名 字 \n 陌生 人 ,我 也 为 你 祝 
福 \n 愿 你 有 一 个 灿烂 的 前 程 \n 愿 你 有 情人 终 成 眷属 \n 愿 你 在 尘世 获得 幸福 \n 我 只 愿 面 朝 大 海 ， 春 暖 
花 开 \n") 

从 明天 起 ,做 一 个 幸福 的 人 

RE, BPUS, 周游 世界 

从 明天 起 ,关心 粮食 和 蔬菜 

我 有 一 所 房子 , 面 朝 大 海 ,， 春暖 花 开 

-E 由 于 篇 幅 有 限 , 这 里 省 略 打印 的 内 容 


如 有 果 行 数 非常 多 ,又 会 给 我 们 市 来 不 小 的 困扰 了 …… 好 在 Python 总 是 设身处地 地 为 我 
们 着 想 一 一 只 需要 使 用 三 重 引 号 字符 串 (""" 内 容 """) 就 可 以 轻松 解决 问题 : 


p 


>>> print 
从 明天 起 , 做 一 个 幸福 的 人 

RE, BR, 周游 世界 

从 明天 起 , 关心 粮食 和 蔬菜 

我 有 一 所 房子 , HHK, ERER 


从 明天 起 ， 和 每 一 个 亲人 通信 
告诉 他 们 我 的 幸福 
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那 幸福 的 闪电 告诉 我 的 
我 将 告诉 每 一 个 人 


给 每 一 条 河 每 一 座 山 取 一 个 温暖 的 名 字 
陌生 人 ，, 我 也 为 你 祝福 

愿 你 有 一 个 灿烂 的 前 程 

愿 你 有 情人 终 成 眷属 

愿 你 在 尘世 获得 幸福 

dk HL BE SA, 春暖 花 开 


uu g 


从 明天 起 ,做 一 个 幸福 的 人 

(IQ, BUE, 周游 世界 

从 明天 起 , 关心 粮食 和 蔬菜 

我 有 一 所 房子 , HHK, ERER 
-H 篇 幅 有 限 , 这 里 省 略 打印 的 内 容 


最 后 需要 提醒 大 家 的 是 ,编程 的 时 候 , 时 刻 要 注意 Speak English! 初学 者 最 容易 犯 的 错 
误 ( 没 有 之 一 ) 就 是 误 用 了 中 文 的 标点 符号 。 切 记 : 编程 中 使 用 的 标点 符号 都 是 英文 的 ! 


3.5 改进 我 们 的 小 游戏 


ane 

不 得 不 承认 ,之 前 的 小 游戏 真 的 是 太 简单 了 。 有 很 多 朋友 为 此 提出 了 不 少 的 建议 ,小 甲鱼 
做 了 一 下 总 结 , 大 概 有 以 下 几 个 方面 需要 改进 : 

OD 当 用 户 猜 错 的 时 候 程 序 应 该 给 点 提示 ,比如 告诉 用 户 当 然 输入 的 值 比 答案 是 大 了 还 
是 小 了 。 

(2) 每 运行 一 次 程序 只 能 猜 一 次 ,应 该 提供 多 次 机 会 给 用 户 猜 测 , 至 少 要 三 次 嘛 ,人 非 圣 
贤 , 训 能 一 击 即 中 ,你 说 是 吧 ?1 

(3) 每 次 运行 程序 ,答案 可 以 是 随机 的 。 因 为 程序 答案 固定 ,容易 导致 答案 外 泄 , 比 如 小 
红 玩 了 之 后 知道 正确 答案 是 8, 就 可 能 会 把 结果 告诉 小 明 , 小 明 又 会 乱 说 。 所 以 乔 望 游戏 的 答 
案 可 以 是 随机 的 。 

这 些 挑战 对 于 如 此 聪明 的 读者 来 说 一 定 不 成 问题 ,让 我 们 抄 起 家 伙 (Python) 一 个 个 来 解 
Jes! 


8.6 条 件 分 支 


第 一 个 改进 要 求 : 当 用 户 猜 错 的 时 候 程 序 应 该 给 点 提示 ,比如 告诉 用 户 当 然 输 入 的 值 比 
答案 是 大 了 还 是 小 了 。 程 序 改进 后 (假如 答案 是 8) : 

。 如 采用 户 输入 3 ,程序 应 该 提示 比 答案 小 了 。 

。 如 采用 户 输入 9 ,程序 应 该 提示 比 答案 大 了 了 。 

这 就 涉及 一 个 比较 的 问题 了 ,作为 初学 者 ,可 能 不 大 熟悉 计算 机 是 如 何 进 行 比较 吧 ? 但 我 
想 大 家 都 一 定 认 识 大 于 号 (二 )、 小 于 号 (二 ) 以 及 等 于 号 (二 = 二)( 注 : 在 Python 中 ,用 两 个 连续 
等 号 表示 等 于 号 ,用 单独 一 个 等 号 表示 赋值 ,还 记得 吧 ? 那 不 等 于 呢 ? 嗯 ,不 等 于 这 个 有 点 特 


yes 
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殊 ,用 感叹 号 和 一 个 等 号 搭配 来 表示 ) 。 
另外 ,还 需要 掌握 Python 的 比较 操作 符 有 : 


<,< = ,>,>= , == ,!= 
在 IDLE 中 输入 两 个 数 以 及 比较 操作 符 ,Python 会 返回 比较 后 的 结 采 : 


>>>1<3 

True 

>>>1>3 

False 

>>> 1 == 3 

False 

>>> 1 != 3 

True 

这 里 1 和 3 进行 比较 ,判断 1 是 否 小 于 3, 在 小 于 号 左右 分 别 留 了 一 个 空格 ,这 不 是 必需 
的 ,但 代码 量 一 多 ,看 上 去 会 美观 很 多 。Python 是 一 个 注重 审美 的 编程 语言 ,这 就 跟 人 一 样 ， 
人 长 得 怎样 是 天 生 的 ,一般 无 法 改变 ,但 人 的 气质 修养 是 可 以 从 每 个 细小 动作 看 出 来 的 ,人 们 
说 心灵 美 才 是 美 , 指 的 就 是 这 一 方面 。 Té E FE. up LARA LU LR ER BRL. HL ORCI HB 
误 , 但 别人 阅读 你 的 代码 时 很 难受 ,他 就 不 愿 跟 你 一 起 合作 开发 ,要 是 你 的 代码 工整 ,注释 得 
当 , 远 远 看 上 去 犹如 大 家 之 作 , 那 结果 肯定 不 用 说 啦 ! 

大 家 还 记得 if-else 吧 ? 如 条 程序 仅仅 只 是 一 个 命令 清单 的 话 , 那 么 他 只 需要 笔直 地 一 条 
路 走 到 黑 , 但 至 少 觉得 应 该 把 程序 设计 得 更 聪明 点 可 以 根据 不 同 的 条 件 执行 不 同 的 任务 ， 
这 就 是 条 件 分 支 。 

if 条 件 : 

条 件 为 真 (True) 执 行 的 操作 


else: 


条 件 为 假 (False) 执 行 的 操作 
那 现在 让 我 们 把 第 1 个 要 求 的 代码 写 出 来 吧 : 


if guess == secret: 
print(" IIF , f Jé /]v FP f f E B5) d] rho n? 1") 
print(" 哼 一 猜 中 了 也 没有 奖励 !") 
else: 
if guess > secret: 
peint WA FA ome) 


else: 
print(" 嘿 ,小 了 小 了 一 一 一 ") 


6.7 while 循环 
2 


第 1 个 要 求实 现 了 ,可 是 用 户 还 不 高 兴 , 他 们 会 抱怨 道 : “为 什么 我 要 不 停 地 重新 运行 你 
这 个 程序 呢 ? 难 道 你 不 能 每 次 运行 多 给 几 次 输入 的 机 会 吗 ?”( 我 们 这 个 程序 还 好 , 几 次 尝试 就 
可 以 成 功 了 ,但 如 果 范 围 扩大 为 1 一 100 ,那么 尝试 的 次 数 就 要 随 之 增加 ,总 让 用 户 不 断 地 重新 
打开 程序 ,这 种 程序 的 体验 未 免 就 太 差 了 喻 !1) 
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第 2 个 改进 要 求 : 程序 应 该 提供 多 次 机 会 给 用 户 猜 测 ,专业 点 来 讲 就 是 程序 需要 重复 运 
行 某 些 代码 。 
下 面 介绍 Python 的 while 循环 语法 。 


while 条 件 : 
条 件 为 真 (True) 执 行 的 操作 


非常 简单 ,对 吧 ? Python 一 加 就 是 这 么 简单 , 那 一 起 来 修改 代码 吧 : 


while guess != 8: 
temp = input(" 哎 呀 , 猜 错 了 ,请 重新 输入 吧 :") 
guess = int(temp) 


if guess == 8: 
print(" 哎 呀 ,你 是 小 甲鱼 肚 里 的 映 虫 吗 ?!") 
print(" 哼 一 猜 中 了 也 没有 奖励 !") 
else: 
if guess > 8: 
print(" NATAT -—-—-—") 
else: 
print("WB,/]v T NT ———") 
聪明 的 谈 者 可 能 已 经 发 现 了 ,这 么 改 的话 ,程序 的 意思 是 只 有 用 户 输入 正确 的 数字 循环 才 
能 结束 。 这 好 像 跟 我 们 的 第 2 个 要 求 有 点 不 同 了 ,所 以 大 家 不 妨 边 思考 边 动手 ,看 怎么 改 才 是 
正确 的 。 
给 大 家 一 点 提示 ,大 家 思考 一 下 如 何人 和 修改 ,这 里 我 给 大 家 的 提示 是 : 使 用 and 逻辑 操作 
fj. Python 的 逻辑 操作 符 可 以 将 任意 表达 式 连 接 在 一 起 ,并 得 到 一 个 布尔 类 型 的 值 。 布 尔 类 
型 只 有 两 个 值 : True 和 False, 就 是 真 与 假 ,来 看 下 面 的 例子 : 


>>> (3 > 2)and(1 < 2) 

True 

>>> (3 > 2)and(1 > 2) 

False 

很 明显 ,1 二 2 这 个 条 件 是 个 伪 命 题 , 所 以 and 的 结果 为 假 。 用 and 逻辑 操作 符 运行 ,只 有 
当 两 边 的 条 件 均 为 真 时 ,结果 才能 是 True, 和 否则 为 False, 大 家 可 以 自己 多 做 几 次 实验 来 证 明 。 


8.8 引入 外 援 
<D 


第 3 个 改进 要 求 : 每 次 运行 程序 ,答案 是 随机 的 。 需 要 怎么 实现 呢 ? 需要 引入 外 援 : 
random 模块 ， 

等 等 ,模块 这 个 名 字 怎 么 那么 熟悉 ? 

啊 哈 1 想起 来 了 ,每 次 写 完 程序 的 时 候 , 都 要 按 一 下 快捷 键 F5 运行 ,那里 就 显示 大 RUN 
MODULE, 我 们 编写 的 程序 实际 上 就 是 一 个 模块 ,只 是 我 们 目前 还 没有 发 觉 。 

那 这 个 random module 里 边 有 一 个 图 数 叫 作 randint(), 它 会 返回 一 个 随机 的 整数 。 可 以 
利用 这 个 函数 来 改造 我 们 的 游戏 : 


# p3_1.py 
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import random 


secret = random. randint(1,10) 
temp = :input(" 不 妨 猜 一 下 小 甲鱼 现在 心里 想 的 是 哪个 数字 : ") 
guess = int(temp) 


while guess != secret: 
temp = input(" 哎 呀 , 猜 错 了 ,请 重新 输入 吧 : U) 
guess = int(temp) 


if guess > secret: 
print(" H, X f XT ~~~") 
else: 
print( "上 嘿 , 小 了 小 了 一 一 一 ") 


if guess == secret: 
print("Wy IF , ff Ji /]v P Eb E hg d] h n3? 1") 
print(" 哼 一 猜 中 了 也 没有 奖励 ! ") 


print(" 游 戏 结 束 ,不 玩 啦 ^^") 


@.9 闲聊 数据 类 型 


在 此 之 前 ,你 可 能 已 经 听 说 过 , 咱 这 个 Python 的 变量 是 没有 类 型 的 。 对 , 没 错 , 小 甲鱼 也 


曾经 说 过 ,Python 的 变量 更 像 是 名 字 标 签 , 想 贴 哪儿 就 贴 哪儿 。 通 过 这 个 标签 ,就 可 以 轻易 找 
到 变量 在 内 存 中 对 应 的 存放 位 置 了 。 


但 这 绝 不 是 说 Python 就 没有 数据 类 型 这 回 事 。 大 家 还 记得 '520' 和 520 的 区 别 吗 ? 
没 错 , 市 了 引号 的 ,无 论 是 双 引 号 还 是 单 引 号 或 者 是 三 引号 ,都 是 字符 串 ;， 而 不 市 引号 的 ， 


就 是 数字 。 字 符 串 相 加 叫 作 拼 接 , 咳 咳 ,不 是 拼 移 ,是 拼接 ! 数字 相 加 就 会 得 到 两 个 数字 的 和 : 


>>> 520 + '1314' 
'5201314' 

>>> 520 + 1314 
1834 


Python 有 很 多 重要 的 数据 类 型 ,不 过 这 里 不 会 一 下 子 全 都 扔 给 大 家 。 因 为 一 来 你 肯定 一 


下 子 记 不 了 那么 多 ; 另外 现在 所 要 和 擎 握 的 知识 还 不 需要 这 么 多 的 数据 类 型 来 配合 实现 。 所 
以 ,每 个 阶段 所 学 习 的 内 容 都 是 必要 的 ,我 们 也 只 学 习 那 些 必 要 的 内 容 。 


Python 的 字符 串 类 型 已 经 简单 讲 过 ,后 边 还 会 对 字符 串 进 行 深 入 的 探讨 ,所 以 大 家 别 吐 


槽 小 甲鱼 怎么 都 是 浅 尝 辑 止 ,没有 那 回 事 儿 ! 响 只 是 分 阶段 逐步 渗透, 逐 层 进行 消化 ,一 下 子 
说 太 深 入 ,大 家 消化 不 了 ,教学 也 会 变 成 纯 理 论 化 (小 甲鱼 知道 死板 的 模式 是 大 家 最 讨厌 的 )，。 


今天 来 介绍 一 些 Python 的 数值 类 型 又 包含 整 型 . 浮 点 型 .布尔 类 型 复数 类 型 等 。 
3.9.1 整 型 
整 型 说 日 了 就 是 平时 所 见 的 整数 ,Python3 的 整 型 已 经 与 长 整 型 进行 了 无 缝 结合 ,现在 的 
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Python3 的 整 型 类 似 于 Java 的 BigInteger 类 型 , 它 的 长 度 不 受 限制 ,如 果 说 非 要 有 个 限制 , 那 
只 限于 计算 机 的 虚拟 内 存 总 数 。 所 以 用 Pythons 很 容易 进行 大 数 计算 。 


98:9-2- i35 HI 


浮 点 型 就 是 平时 所 说 的 小 数 ,例如 圆周 率 3. 14 是 浮 点 型 ,例如 地 球 到 太阳 的 距离 大 约 
1. 5 4L TOK BEFA, Python 区 分 整 型 和 浮 点 型 的 唯一 方式 ,就 是 看 有 没有 小 数 点 。 

谈 到 浮 点 型 ,不 得 不 说 下 EF 记 法 。E 记 法 也 就 是 平时 所 说 的 科学 计数 法 ,用 于 表示 特别 
大 和 特别 小 的 数 .: 

>>> a = 0.0000000000000000000025 


>> a 
2.5e— 21 


对 于 地 球 到 太阳 的 距离 1. 5 44 FX. 如果 转换 成 米 的 话 , 那 就 是 一 个 非常 大 的 数 了 
(150 000 000 000) ,但 是 如 果 你 用 下 记 法 就 是 1.5ell( 大 玉 和 小 e 都 可 以 )。 

其 实 大 家 应 该 已 经 发 现 了 ,这 个 王 的 意思 是 指数 , 指 底 数 为 10,E 后 边 的 数字 就 是 10 的 
多 少 次 寡 。 像 15 000 等 于 1.5X10 000, 也 就 是 1.5X104,E 记 法 写成 1. 5e4。 


3.9.3 布尔 类 型 


布尔 类 型 事实 上 是 特殊 的 整 型 ,尽管 布尔 类 型 用 True 和 False 来 表示 “ 真 ” 与 “ 假 ”, 但 布 
尔 类 型 可 以 当 作 整数 来 对 待 ,True 相当 于 整 型 值 1. False 相当 于 整 型 值 0, 因 此 下 边 这 些 运 算 
都 是 可 以 的 (最 后 的 例子 报错 是 因为 False 相当 于 0, 而 0 不 能 作为 除数 ) 。 

>>> True + True 

2 

>>> True * False 

0 

>>> True / False 

Traceback (most recent call last): 

File "< pyshell£ 49>", line 1, in < module» 
True / False 
ZeroDivisionError: division by zero 


当然 把 布尔 类 型 当成 1 和 0 2E is SEURP IIGUS Ji AI ET] 3 ER JR IUE Je 74 Ie — Rb 
一 样 ,所 以 大 家 知道 就 好 , 千 万 别 在 实际 应 用 中 这 么 去 做 ! 


3.9.4 类 型 转换 


接 下 来 介绍 几 个 跟 数 据 类 型 紧密 相关 的 困 数 : int() float() 和 str()。 
int() 的 作用 是 将 一 个 字符 串 或 浮 点 数 转换 为 一 个 整数 . 


>>>a = '520' 
»»» b = int(a) 
>>> a, b 
('520', 520) 


>>> C = 5.99 
>>>d = int(c) 
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»»c,d 
(5.99, 5) 


注意 了 ,如 果 是 浮 点 数 转换 为 整数 ,那么 Python 会 采取 “截断 ”处 理 , 就 是 把 小 数 点 后 的 
数据 直接 人 砍 挥 ,注音 不 是 四 舍 五 入 哦 ! 
float() 的 作用 是 将 一 个 字符 串 或 整数 转换 成 一 个 浮 点 数 ( 就 是 小 数 啦 ): 


>>>a = '520' 
»»» b = float(a) 
>>> ay b 

('520', 520.0) 
>>> C = 520 

>>> d = float(c) 
»»c,d 

(520, 520.0) 


str() 的 作用 是 将 一 个 数 或 任何 其 他 类 型 转换 成 一 个 字符 串 : 


>>>a = 5.99 

>>> b = str(a) 

>>> þ 

'5.99' 

»»» c = str(5el5) 
>>> C 
'5000000000000000.0' 


3.9.5 获得 关于 类 型 的 信息 


有 时 候 可 能 需要 确定 一 个 变量 的 数据 类 型 ,例如 用 户 的 输入 , 当 需 要 用 户 输入 一 个 整数 ， 
但 用 户 却 输 入 一 个 字符 串 , 就 有 可 能 引发 一 些 意 想不到 的 错误 或 导致 程序 朋 湿 ! 

现在 告诉 天 家 一 个 好 消息 ,Python 其 实 提供 了 一 个 函数 ,可 以 明确 告诉 我 们 变量 的 类 型 ， 
这 就 是 typeO RŽ: 


>>> type('520') 
«class 'str'» 
>>> type(5.20) 
«class 'float' 
>>> type(5e20) 
< class 'float'> 
>>> type(520) 
«class 'int'» 
>>> type(True) 
«class 'bool > 


当然 , 通 问 罗马 的 道路 非常 多 ,无须 在 一 棵 树 上 吊 死 ,查看 Python 的 帮助 文档 , 它 更 建议 
我 们 使 用 isinstance() 这 个 BIF 来 确定 变量 的 类 型 。 这 个 BIF 有 两 个 参数 : 第 一 个 是 待 确定 
类 型 的 数据 ; 第 二 个 是 指定 一 个 数据 类 型 。 

isinstance() 会 根据 两 个 参数 返回 一 个 布尔 类 型 的 值 ,True 表示 类 型 一 臻 ,False 表示 类 型 
不 一 致 : 
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>>> a = "小 甲鱼 " 

>>> isinstance(a, str) 
True 

>>> isinstance(520, float) 
False 

>>> isinstance(520, int) 
True 


3.10 常用 操作 符 


3.10.1 算术 操作 符 


和 绝 大 多 数 编程 语言 一 样 ,Python 的 算术 操作 符 大 部 分 和 我 们 理解 的 一 样 ,注意 ,这 里 说 
的 是 大 部 分 ,不 是 全 部 : 


E 一 x / & xx // 


前 边 四 个 就 不 用 介绍 啦 MARR, KKE, AI SEE a ND AANER RA , 

例如 , 当 你 想 对 一 个 变量 本 号 进行 算术 运算 的 时 候 , 你 是 不 是 会 觉得 写 a 二 a 十 1 或 b = 
b - 3 这 类 操作 符 特别 麻烦 ? 没 错 , 在 Python 中 可 以 做 一 些 简化 : 

>>>a= b=c= d= 10 

>>> a t= 1 

>> b -= 3 

>>>c * = 10 

>>>d/= 8 

>>> print(a, b, c, d) 

11 7 100 1.25 

如 果 使 用 过 Python2. x 版 本 的 读者 可 能 会 发 现 , 咱 Python 的 除法 变 得 有 些 不 同 了 。 包 
插 很 多 编程 语言 ,整数 除法 一 般 都 是 采用 floor 的 方式 ,有 些 书籍 称 为 地 板 除 法 ( 注 : 因为 floor 
的 翻译 就 是 地 板 的 意思 )。 地 板 除 法 的 概念 是 : 计算 结果 取 比 商 小 的 最 大 整 型 ,也 就 是 舍弃 小 
数 的 意思 ( 注 : 例如 37 2 等 于 1)。 但 是 在 这 里 我 们 发 现 , 即 使 是 进行 整数 间 的 除法 ,但 是 答案 
是 自动 返回 一 个 浮 点 型 的 精确 数值 ,也 就 是 Python 用 真正 的 除法 代 蔡 了 地 板 除 法 。 


那 有 些 朋 友 不 乐意 了 ,他 说 " 蔓 卜 青 莱 各 有 所 爱 ,我 就 喜欢 原来 的 除法 ,我 觉 着 整数 除 以 整 
数 就 应 该 得 到 一 个 整数 嘛 ,”Python 团队 也 为 此 想 好 了 后 路 ,就 是 大 家 看 到 的 双 斜 丁 , 它 执行 
的 就 是 地 板 除 法 的 操作 ,不 过 要 注意 一 点 的 是 ,无 论 是 整数 运算 还 是 浮 点 数 运算 ,都 会 执行 地 
板 除 法 : 

4 72 

1 

>>> 3.0 // 2 

1.0 


XT Python3 Æ BRA iZ $t. E 5 E , SERF I ANR 3 JLP e i UE E A E RE A Eh 
法 ,因为 Python 的 除法 运算 从 一 开始 的 设计 就 有 失误 ,但 有 些 人 又 不 想 因 此 修改 自己 的 海量 
代码 ,而 剩 下 的 人 则 想 要 真正 的 除法 。 无 论 皇 样 ,Python 团队 是 秉承 着 追求 完美 和 早 越 的 思 
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维 去 一 次 次 改进 Python 这 门 编程 语言 ,所 以 小 甲鱼 说 Python3 已 经 是 非常 棒 的 版 本 了 。 
百 分 号 (%) 表 示 求 余数 的 意思 : 
>>>5 $% 2 
1 
>>4 $% 2 
0 


>>> 520 % 14 
2 


3.10.2 优先 级 问题 


当 一 个 表达 式 存在 着 多 个 运算 符 的 时 候 , 就 可 能 会 发 生 以 下 对 话 。 

加 法 运算 符 说 :“ 我 先 到 的 ,我 先 计 算 1” 

乘法 运算 符 说 :“ 哥 我 干 一 次 够 你 翻 几 个 圈 了 , 哥 先 来 !” 

减法 运算 符 说 :“ 你 糊涂 了 ,我 现在 被 当成 负 号 使 用 ,没有 我 ,你 们 上 再 努力 ,结果 也 是 得 到 
相反 的 数 1” 

除法 运算 符 这 时 候 上 默默 地 说 :“ 抢 吧 抢 吧 ,老娘 我 除 以 零 , 大 不 了 大 家 同归于尽 1” 

Jib! 为 了 防止 以 上 矛盾 的 出 现 , 我 们 规定 了 运算 符 的 优先 级 , 当 多 个 运算 符 同 时 出 现在 一 
个 表达 式 的 时 候 , 严 格 按照 优先 级 规定 的 级 别 来 进行 运算 。 

先 乘 除 ,后 加 减 , 如 有 括号 先 运 行 括号 里 边 的 。 没 错 , 从 小 学 我 们 就 学 到 了 运算 符 优 先 级 
的 精 艇 ,在 编程 中 也 是 这 么 继承 下 来 的 。 例 如 : 

-3x*x2+5/-2-4 
相当 于 

(-3)*2t15/(-2) -4 

其 实 这 个 多 做 练习 目 然 就 记 住 了 ,不 用 刻意 去 背 。 当 然 在 适当 的 地 方 加 上 括号 强调 一 下 
优先 级 小 甲鱼 觉得 会 是 更 好 的 方案 。 

Python 还 有 一 个 特殊 的 乘法 ,就 是 双星 号 ( xx ) ,也 称 为 寡 运 算 操作 符 。 例 如 3 *x 2, 双 星 号 
左 侧 的 3 称 为 底数 , 右 侧 的 2 称 为 指数 ,把 这 样 的 算式 叫 作 3 的 2 次 需 , 结 果 就 是 3* 3——9, 

在 使 用 Python 进行 究 运 算 的 时 候 , 需 要 注意 的 一 点 是 优先 级 问题 ,因为 究 运 算 操 作 符 和 
一 元 操作 符 2 的 优先 级 关系 比较 特别 . 短 运 算 操作 符 比 其 左 侧 的 一 元 操作 符 优 先 级 高 , 比 其 右 
侧 的 一 元 操作 符 优先 级 低 : 


>> -3 * * 2 

-9 

m X34 4 一 2 
0.1111111111111111 


3.10.3 比较 操作 符 
比较 操作 符 包括 : 


O 例如 减 号 被 当 作 表示 负数 的 符号 来 用 的 时 候 , 它 就 是 一 元 操作 符 , 因 为 它 只 有 一 个 操作 数 嘛 ! 
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这 个 之 前 讲 过 了 ,比较 操作 符 根 据 表 达 式 的 值 的 真 假 返回 布尔 类 型 的 值 。 这 里 不 重复 讲 
解 ,列举 出 来 给 大 家 回顾 一 下 而 已 。 


3.10.4 -逻辑 操作 符 
逻辑 操作 符 包 括 : 


and or not 


and 操作 符 之 前 已 经 学 习 过 ,在 实例 中 也 多 次 使 用 , 当 只 有 and 操作 符 左边 的 操作 数 为 
真 ,上 且 右边 的 操作 符 同 时 为 真 的 时 候 , 结 果 为 真 。 

or 操作 符 跟 and 操作 符 不 同 ,or 操作 符 只 需要 左边 或 者 右边 任意 一 边 为 真 , 结 果 都 为 真 ; 
只 有 当 两 边 同 时 为 假 , 结 果 才 为 假 。 

not 操作 符 是 一 个 一 元 操作 符 , 它 的 作用 是 得 到 一 个 和 操作 数 相 反 的 布尔 类 型 的 值 : 

>>> not True 

False 

>>> not 0 

True 


>>> not 4 
False 


噢 ,对 了 ,你 可 能 会 看 到 这 样 的 表达 式 : 

EE 

这 在 其 他 编程 语言 一 般 是 不 合法 的 ,但 在 Python 中 是 行 得 通 的 , 它 事实 上 被 解释 为 : 
3<4and4<5 


最 后 ,将 目前 接触 的 所 有 操作 符 的 优先 级 合并 在 一 起 ,如 图 3-1 所 示 。 


< <= > >= = l- 


not and or 


图 3-1 Python 操作 符 优 先 级 
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4.1 分 支 和 循环 


有 人 说 ,了 不 起 的 C 语言 ,因为 “机 器 码 生 汇编 ,汇编 生 C,C 生 万 物 ”， 它 几乎 铸造 了 如 今 
IT 时 代 的 一 切 , 它 是 一 切 的 开端 ,并 且 仍 然 没 被 日 新 月 异 的 时 代 所 淘汰 。 

有 人 可 能 会 反对 ,因为 首先 C 语言 不 是 世界 上 第 一 门 编程 语言 , 它 仍然 要 被 降级 为 汇编 
ido 

这 话题 扯 得 有 点 太 远 了 ,小 甲鱼 想 说 的 是 ,其 实 很 多 初学 者 会 对 编程 语言 有 一 种 莫名 其 妙 
的 崇拜 感 ?” 所 以 呢 ， — M \ 认 最 牛 的 语言 再 来 学 习 好 它 。 

其 实 , 世 界 上 根本 没有 最 优秀 的 编程 语言 ,只 有 最 合适 的 语言 , 面 对 不 同 的 环境 和 需求 ,就 
会 有 不 同 的 编程 工具 去 迎合 。 

今天 的 主题 是 "了 不 起 的 分 文 和 循环 ”, 为 什么 小 甲鱼 不 说 C 语言 ,不 说 Python 了 不 起 ， 
却 毫 不 音 冀 地 对 分 支 和 循环 这 两 个 知识 点 那么 “崇拜 ” 呢 ? 

大 家 在 前 面 也 接触 了 最 简单 的 分 支 和 循环 的 使 用 ,那么 小 甲鱼 希望 大 家 思考 一 下 : 如 果 
没有 分 支 和 循环 ,我 们 的 程序 会 变 成 怎样 ? 

没 错 , 就 会 变 成 一 堆 从 上 到 下 依次 执行 、 毫 无 趣味 的 代码 ! 还 能 实现 算法 吗 ? 当然 不 能 ! 

幸好 ,所 有 能 称 得 上 编程 语言 的 ,都 应 该 拥有 分 支 和 循环 这 两 种 实现 。 接 下 来 从 游戏 的 角 
度 来 谈 谈 ,“ 打 飞机 ”游戏 相信 大 家 非常 熟悉 了 ,如 图 4-1 所 示 。 

那么 现在 就 从 打 飞 机 来 解释 一 般 游戏 的 组 成 和 架构 。 

首先 进入 游戏 ,很 容易 发 现 其 实 就 是 进入 一 个 大 循环 ,虽然 小 甲鱼 现在 跟 大 家 讨论 的 是 打 
飞机 ,但 基本 上 每 一 个 游戏 的 套路 都 是 一 样 的 ， He T 
大 循环 来 完成 的 。 游 戏 中 ,只 要 没有 触发 死亡 机 制 ( 注 : 这 个 游戏 的 死亡 机 制 是 撞 到 敌 机 ) , 敌 
机 都 会 不 断 地 生成 ,这 足以 证 明 整 个 游戏 就 是 在 一 个 循环 中 执行 的 。 

接 下 来 来 看 一 下 分 支 的 概念 ,分支 也 就 是 所 习惯 使 用 的 庄 条 件 判 断 , 在 条 件 持续 保持 成 
立 或 不 成 立 的 情况 下 ,我们 都 执行 固定 的 流程 。 一 旦 条 件 发 生 了 改变 ,原来 成 立 的 条 件 就 变 成 
不 成 立 , 那 么 程序 就 走 人 男 一 条 路 了 。 就 好 比如 拿 我 们 的 飞机 去 撞击 敌 机 …… 如 图 4-2 
所 示 。 

另外 ,大 家 有 没有 发 现 , 小 飞机 都 是 一 个 样子 的 ? 嗯 ,这 说 明 它 们 来 自 于 同一 个 对 象 的 复 
制品 ,Python 是 面 回 对 象 的 编程 ,对 象 这 个 概念 无 时 无 刻 不 融 人 在 Python 的 血液 里 ,只 是 暂 
时 还 没有 接触 这 个 概念 ,所 以 有 些 朋 友 还 意识 不 到 ,不 用 急 ,以 后 会 详细 讲解 这 个 概念 的 。 
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& 飞机 大 战 -- FishC Demo 一 O 


ocore : 185000 


图 4-1 打 飞 机 游戏 图 4-2 打 飞 机 游戏 结束 界面 


最 后 我 要 不 要 告诉 大 家 这 个 小 游戏 就 只 是 用 了 几 个 循环 和 if 条 件 就 写 出 来 啦 ? 没 错 , 编 
程 其 实 就 是 这 么 简单 。 当 然 大 家 要 达到 自己 可 以 动手 写 一 个 界面 小 游戏 的 水 平 ,还 需要 掌握 
更 多 的 知识 ! 现在 需要 大 家 一 起 来 动手 ,按照 刚才 看 到 的 小 游戏 ,请 拿 出 纸 和 笔 ,将 它 的 实现 
逻辑 尝试 给 勾画 出 来 (可 以 使 用 文字 描述 ,现在 只 谈 框架 ,不 谈 代 码 )，。 

参考 框架 如 下 : 


加 载 背 景 音乐 
播放 背景 音乐 
我 方 飞机 诞生 


interval = 0 


while True: 
证 用户 是 否 单 击 了 关闭 按钮 ; 
退出 程序 


interval += 1 


if interval == 50: 
小 飞机 诞生 
小 飞机 移动 一 个 位 置 
屏幕 刷新 
interval = 0 


if 用 户 鼠 标 产生 移动 : 
我 方 飞机 中 心 位 置 = 用 户 鼠 标 位 置 
屏幕 刷新 
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if 我 方 飞机 与 小 飞机 发 生 肢体 接触 : 
我 方 挂 ,播放 撞 机 音乐 
修改 我 方 飞机 图 案 
打印 "GRME OVER" 
停止 背景 音乐 


4.2 课堂 小 练习 


ob AUR 
前 面 教 大 家 如 何 正确 打 飞 机 ,其 要 点 就 是 : 判断 和 循环 ,判断 就 是 应 不 应 该 做 某 事 ,循环 
就 是 持续 做 某 事 。 条 件 分 支 ,也 就 是 判断 ,习惯 用 到 的 是 if-else 的 搭配 ,而 循环 就 用 我 们 已 经 
掌握 了 的 while 语句 。 
现在 来 考 考 大 家 : 按照 100 分 制 ,90 分 以 上 成 绩 为 A,80 一 90 为 B,60 一 80 为 C,60 以 下 
为 D。 现 在 要 求 你 写 一 个 程序 , 当 用 户 输入 分 数 , 自 动 转换 为 A、B、C 或 DD 的 形式 打印 。 


# p4_1.py 

score = int(input( ' 请 输入 一 个 分 数 : ')) 

if 100 >= score>= 90: 
print('A') 

if 90 > score >= 80: 
print( 'B') 

if 80» score >= 60: 
print( 'C') 

if 60 > score >= 0: 
print( 'D') 

if score < 0 or score > 100: 


print( ' 输 入 错误 ! ') 
当然 你 也 可 以 写成 ; 


# p4 2.py 
score = int(input( ' 请 输入 您 的 分 数 : ')) 
if 100 >= Score>= 90: 
print('A!) 
else: 
if 90 > score >= 80: 
print( 'B') 
else: 
if 80 > score >= 60: 
print('C') 
else: 
if 60 > score >= O0: 
print( 'D') 
else: 


print( ' 输 入 错误 !) 
如 果 是 这 样 写 ,条件 多 了 可 能 会 有 诸多 不 便 , 你 完全 可 以 偷懒 一 下 : 
# p4 3.py 
score = int(input( ' 请 输入 一 个 分 数 : ')) 


if 100 >= Score >= 90: 
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print('A') 

elif 90 > score >= 80: 
print( 'B') 

elif 80 > score» - 60: 
print( 'C') 

elif 60 > score» - O0: 
print( 'D') 

else: 


print( 输入 错误 ! ') 


4.3 结果 分 析 


假设 输入 的 分 数 是 98 ,按照 第 一 种 方法 是 第 一 次 判断 成 立 ,接着 打印 字母 A, 但 接着 会 进 
4198 — 三、 四 \ 五 次 判断 ,然后 条 件 都 不 符合 ,退出 程序 。 

右 采 用 第 二 、 第 三 种 方法 ,那么 在 第 一 次 判断 成 立 并 打印 字母 A 后 ,接着 不 需要 再 进行 任 
何 判 断 就 可 以 直接 退出 程序 。 可 见 虽 然 是 很 简单 的 例子 ,但 就 输入 的 98 来 说 ,假设 每 一 次 判 
断 会 消耗 一 个 CPU 时 间 ,那么 第 一 种 方法 比 第 二 和 第 三 种 方法 多 消耗 了 400%% 的 时 间 ! 

所 以 要 实现 一 个 程序 事实 上 并 不 难 , 但 作为 一 个 优秀 的 程序 员 ,你 必须 要 形成 展 好 的 编程 
思维 。 而 Python 这 门 语言 本 里 就 可 以 锻炼 你 这 方面 的 能 力 。 不 信 ? 来 看 下 一 个 问题 : 
Python 可 以 有 效 避 人 免 “ 甚 挂 else", 


4.4 Python RJ ELS SD $6" E j£ else" 


fF A mp" else"? 举 个 例子 ,初学 C 语言 的 朋友 可 能 很 容易 被 以 下 代码 欺骗 。 
if ( hi>2) 
if( hi»7) 
printf(" 好 棱 ! 好 棱 !"); 
else 
print£("9] —"); 
在 这 个 例子 中 ,虽然 else 是 想 和 外 层 的 庄 匹 配 , 但 事实 上 按照 C 语言 的 就 近 匹 配 原 则 这 
个 else 是 属于 内 层 if 的 。 由 于 初学 者 的 一 不 小 心 , 就 容易 守 致 BUG 的 出 现 。 这 就 是 著名 的 
“悬挂 else", 
而 Python 的 缩 进 使 用 强制 规定 使 得 代码 必须 正确 对 齐 , 让 程序 员 来 决定 else 到 底 属 于 
哪 一 个 让。 限制 你 的 选择 从 而 减少 了 不 确定 性 ,Python 至 励 你 第 一 次 就 写 出 正确 的 代码 。 所 
以 在 Python HP dli di 2 E else” 的 问题 是 不 可 能 的 。 而 且 , 强 制 使 用 正确 的 缩 进 ,Python 的 
代码 变 得 整洁 易 谈 ,这 就 是 大 家 都 喜欢 Python 的 原因 。 


4.5 条 件 表达 式 ( 三 元 操作 符 ) 


我 们 说 “多 少 元 ”操作 符 的 意思 是 这 个 操作 符 有 多 少 个 操作 数 。 例 如 赋值 操作 符 “ 二 ”是 二 
元 操作 符 , 所 以 它 有 左边 和 右边 两 个 操作 数 。 例 如 “-” 是 一 元 操作 符 , 它 表示 负 号 ,因为 只 有 一 
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个 操作 数 。 那 么 三 元 操作 符 就 应 该 有 三 个 操作 数 咯 ?” 没 错 的 ,你 猿 对 了 o 

其 实 Python 的 作者 一 问 推 党 人 简洁 编程 理念 ,所 以 很 长 一 段 时 间 Python 都 没有 三 元 操作 
符 这 么 个 概念 (因为 Python 和 觉得 三 元 操作 符 使 得 程序 结构 变 复杂 了 ), 但 是 Python 社区 的 小 
伙伴 们 表达 了 极 大 的 诉求 ,所 以 最 终 Python 的 作者 为 Python 加 入 了 这 个 三 元 操作 符 。 有 了 
这 个 三 元 操作 符 的 条 件 表达 式 ,你 可 以 使 用 一 条 语句 来 完成 以 下 的 条 件 判 断 和 赋值 操作 : 


ifx«y: 
small = x 
else: 
small - y 
那么 将 上 边 的 代码 用 传说 中 的 三 元 操作 符 表 示 应 该 是 怎样 的 呢 ? 
三 元 操作 符 语 


a-x if 条件 else y 


表示 当 条 件 为 True 的 时 候 ,a 的 值 赋值 为 x, 否 则 赋值 为 y。 
所 以 ,上 面 的 例子 可 以 改进 为 : 


small = x if x< y else y 


4.6 断言 


Wr A CasserO Ii TR HE KA SRE f RIF 8] 19 " Yr 28" «rr AME — RHE T 
assert 这 个 关键 字 称 为 "断言 ”, 当 这 个 关键 字 后 边 的 条 件 为 假 的 时 候 , 程 序 自 动 前 溃 并 抛 出 
AssertionError [f] 5t 7$ , 

什么 情况 下 需要 这 样 的 代码 呢 ? 当 我 们 在 测试 程序 的 时 候 就 很 好 用 ,因为 与 其 让 错误 的 
条 件 导 致 程序 今后 苋 名 其 妙 地 毅 溃 ,不 如 在 错误 条 件 出 现 的 那 一 瞬间 实现 “上 自我 毁灭 ”: 

>>> assert 3 < 4 

>>> assert 3 > 4 

Traceback (most recent call last): 

File "< pyshell£ 100»", line 1, in < module» 


assert 3 > 4 
AssertionError 


一 般 来 说 ,可 以 用 它 在 程序 中 置 入 检查 点 , 当 需 要 确保 程序 中 的 某 个 条 件 一 定 为 真 才能 让 
程序 正常 工作 时 ,assert 关键 字 就 非常 有 用 了 。 


4.7 while 循环 语句 


Python 的 while 循环 跟 计 条 件 分 支 类 似 , 在 条 件 为 真 的 情况 下 ,执行 一 段 代码 ,不 同 的 
是 ,只 要 条 件 为 真 ,while 循环 会 一 直 重 复 执行 那 段 代 码 ,把 这 段 代 码 称 为 循环 体 。 


while 条 件 : 
循环 体 
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4.8 for 循环 语句 
w 


那么 接 下 来 谈 谈 Python I Tl Zi 28 08 9. E iE for 循环 。 虽 然 说 Python 是 由 C 语言 编 
写 而 来 的 ,但 是 它 的 for 循环 跟 C 语言 的 for 循环 不 太一 样 ,Python 的 for 循环 显得 更 为 智能 
和 强大 ! 这 主要 表现 在 它 会 自动 调用 迭代 器 的 next() 方 法 0, 会 自动 捕获 StopIteration 异常 
并 结束 循环 ,所 以 这 更 像 是 一 个 具有 现代 化 气质 的 for 循环 结构 。 

一 起 来 实验 一 下 : 


>>> favourite = "FishC" 
>>> for each in favourite: 


print(each, end- '') 


FishC 


4.9 range) 
udi 


for 循环 其 实 还 有 一 个 小 伙伴 : rangeO AE KZ. 
WA: 


range( [start, ] stop[, step=1] ) 


这 个 BIF 有 三 个 参数 ,其 中 用 中 括号 括 起 来 的 两 个 表示 这 两 个 参数 是 可 选 的 。step 二 1 
表示 第 三 个 参数 的 默认 值 是 1。 零 基础 的 朋友 因为 还 没有 学 到 函数 ,对 于 参数 这 个 概念 可 能 
不 理解 ,没事 ,暂时 你 就 认为 是 困 数 的 又 备 , 果 数 有 了 装备 攻击 力 什 么 的 都 会 相应 增加 。 

range 这 个 BIF 的 作用 是 生成 一 个 从 start 参数 的 值 开 始 , 到 stop 参数 的 值 结束 的 数字 序 
5|, 7$ 5j for 循环 混迹 于 各 种 计数 循环 之 间 。 

只 传递 一 个 参数 的 range() ,例如 range(5), 它 会 将 第 一 个 参数 默认 设置 为 0, 生 成 0 一 5 
的 所 有 数字 ( 注 : 包含 0 但 不 包含 5 ) 。 


>>> for i in range(5): 


print(i) 


>e U N Be o 


传递 两 个 参数 的 range() : 

>>> for i in range(2, 9): 
print(i) 

2 


(D 在 对 象 中 的 函数 称 为 方法 。 
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传递 三 个 参数 的 range(): 


>>> for i in range(1, 10, 2): 


print(i) 


O s uU Pp 


range() 可 以 说 是 跟 for 循环 最 适合 做 搭档 的 小 伙伴 ,当然 ,for 循环 魅力 很 大 , 它 还 有 其 
他 各 式 各 样 的 小 伙伴 配合 实现 各 种 乱七八糟 的 功能 ,这 个 在 讲解 列表 和 元 组 的 时 候 再 介绍 给 
大 家 吧 。 


4.10 break 语句 


break 语句 的 作用 是 终止 当前 循环 ,跳出 循环 体 。 举 个 例子 : 


# p4 4.py 
bingo = ' 小 甲鱼 是 帅哥 ' 
answer = input( ' 请 输入 小 甲鱼 最 想 听 的 一 句 话 :') 
while True: 

if answer == bingo: 

break 

answer = input( ' 抱 歉 , 错 了 ,请 重新 输入 (答案 正确 才能 退出 游戏 ) : 7) 
print( WI, Jp mg — ') 
print('f&i E E/P f& f F E BS bp h j^ ^") 


程序 运行 后 ,只 有 当 用 户 输入 “小 甲鱼 是 帅哥 ”的 时 候 , 才 会 执行 break 语句 ,也 就 是 跳出 
while 循环 体 : 

>>> 

请 输入 小 甲鱼 最 想 听 的 一 句 话 : 小 甲鱼 是 笨蛋 

抱 菊 , 错 了 ,请 重新 输入 (答案 正确 才能 退出 游戏 ) : 小 甲鱼 是 帅哥 


哎哟 , 帅 哦 一 
ERED P f ity E h a h pjs ^ 


>>> 


4.11 continue 语句 


continue 语句 的 作用 是 终止 本 轮 循环 并 开始 下 一 轮 循环 (这 里 要 注意 的 是 : 在 开始 下 一 
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# p4 5.py 
for i in range(10): 
if i£2!- O0: 
print(i) 
continue 
i += 2 
print(i) 


大 家 不 妨 在 不 运行 程序 的 情况 下 目测 一 下 这 个 程序 会 打印 出 什么 ? 
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[n] i Ja- 
有 时 候 需 要 把 一 堆 东 西 暂 时 存储 起 来 ,因为 它们 有 某 种 直接 或 者 间接 的 联系 ,需要 把 它们 
放 在 某 种 “组 ”或 者 “集合 ”中 ,因为 将 来 可 能 用 得 上 。 很 多 接触 过 编程 的 朋友 都 知道 或 者 听 说 
过 数组 。 数 组 这 个 概念 呢 , 就 是 把 一 大 堆 同 种 类 型 的 数据 挨个 儿 摆 在 一 块 儿 ,然后 通过 数组 下 
标 进 行 索引 。 但 数组 有 一 个 基本 和 要求 ,就 是 你 所 放 在 一 起 的 数据 必须 类 型 一 致 。 由 于 Python 
的 变量 没有 数据 类 型 ,也 就 是 说 ,Python 是 没有 数组 的 。 但 是 呢 ,Python 加 入 了 更 为 强大 的 
列表 。 


Python 的 列表 有 多 强大 ? 如 果 把 数组 比 作 是 一 个 集装箱 的 话 ,那么 Python 的 列表 就 是 
一 个 工厂 的 仓库 了 。 列 表 真 的 非常 有 用 ,基本 上 所 有 的 Python 程序 都 要 使 用 到 列表 ,包括 之 
前 的 打 飞 机 游戏 ,里 边 的 小 飞机 可 以 全 部 扔 到 一 个 列表 中 统一 管理 。 


5.1.1 创建 列表 

创建 列表 和 创建 普通 变量 一 样 ,用 中 括号 括 起 一 堆 数 据 就 可 以 了 ,数据 之 间 用 逗号 隔 开 ， 
这 样 一 个 普 普 通通 的 列表 就 创建 成 功 了 ， 

>>> number = [1, 2, 3, 4, 5] 

我 们 说 列表 是 打 了 激素 的 数组 不 是 没有 道理 的 ,可 以 创建 一 个 鱼龙混杂 的 列表 : 

>>> mix = [1," 小 甲鱼 ", 3.14, [1, 2, 3]] 


可 以 看 到 上 边 这 个 列表 里 有 整 型 .字符 串 、 浮 点 型 数据 ,其 至 还 可 以 包含 看 男 一 个 列表 。 
当然 ,如 果实 在 想不到 要 往 列表 里 边塞 什么 数据 的 时 候 , 可 以 先 创 建 一 个 空 列表 : 


>>> empty = [] 


5.1.2 向 列表 添加 元 素 
列表 相当 灵活 ,所 以 它 的 内 容 不 可 能 总 是 固定 的 ,现在 就 来 教 大 家 如 何 回 列表 添加 元 素 
吧 。 要 问 列 表 添 加 元 素 ,可 以 使 用 append() 方 法 : 


>>> number = [1, 2, 3, 4, 5] 
>>> number. append(6) 
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>>> number 

I1; 2, X4. 4, 5, 8] 

可 以 看 到 ,参数 6 已 经 被 添加 到 列表 number 的 末尾 了 。 有 读者 可 能 会 问 ,这 个 方法 调用 
怎么 跟 平 时 的 BIF UP Br PR ZG] HIA — FE UE? 嗯 ,因为 append() 不 是 一 个 BIF, 它 是 属于 列表 
对 象 的 一 个 方法 。 

中 间 这 个 “.”, 大 家 暂时 可 以 理解 为 范围 的 意思 : append() 这 个 方法 是 属于 一 个 叫 作 
number 的 列表 对 象 的 。 关 于 对 象 的 知识 , 咱 暂 时 只 需要 理解 这 么 多 ,后 边 再 给 大 家 介绍 对 象 。 
同 理 , 我 们 可 以 把 数字 7 和 8 添加 进去 ,但 是 我 们 发 现 似 乎 不 能 用 append() 同 时 添加 多 个 
JU AR : 

>>> number. append(7, 8) 

Traceback (most recent call last): 

File "< pyshell # 122 >", line 1, in < module» 


number. append(7, 8) 
TypeError: append() takes exactly one argument (2 given) 


这 时 候 就 可 以 使 用 extend O Z7 iE I8] 91 A6 AK Fé V8 DIL 1 2C RR : 


>>> number. extend(7, 8) 
Traceback (most recent call last): 
File "< pyshell£ 123»", line 1, in < nodule^ 
number. extend(7, 8) 
TypeError: extend() takes exactly one argument (2 given) 


鹃 呀 ,怎么 又 报错 了 呢 ?! 嗯 ,其 实 小 甲鱼 是 故意 的 。extend() 方 法 事实 上 使 用 一 个 列表 
来 扩展 男 一 个 列表 ,所 以 它 的 参数 应 该 是 一 个 列表 : 

>>> number.extend([7, 8]) 

>>> number 

[1, 2, 3, 4, 5, 6, 7, 8] 

好 ,我 们 又 再 一 次 问世 界 证 明 我 们 成 功 了 ! 但 是 又 发 现 了 一 个 问题 ,到 目前 为 止 , 我 们 都 
是 往 列 表 的 末尾 添加 数据 , 那 如 果 我 想 " 搬 队 ? 呢 ? 

当然 没 问题 , 想 要 往 列 表 的 任意 位 置 搬 和 人 元素 ,就 要 使 用 insert() 方 法 。insert() 方 法 有 
两 个 参数 : 第 一 个 参数 代表 在 列表 中 的 位 置 ,第 二 个 参数 是 在 这 个 位 置 处 插入 一 个 元 素 。 不 
妨 来 试 一 下 ,让 数字 0 出 现在 列表 number 的 最 前 边 : 

>>> number. insert(1, 0) 

>>> number 

[1, 0, 2, 3, 4, 5, 6, 7, 8] 

等 等 ,不 是 说 好 插入 到 第 一 个 位 置 吗 ? 怎么 插入 后 0 还 是 排 在 1 的 后 边 呢 ?其 实 是 这 样 
的 : 凡是 顺序 索引 ,Python 均 从 0 开始 ,同时 这 也 是 大 多 数 编程 语言 约定 俗 成 的 规范 。 那 么 
大 家 知道 为 什么 要 用 0 来 表示 第 一 个 数 吗 ? 

是 因为 计算 机 本 号 就 是 二 进 制 的 ,在 二 进 制 的 世界 里 只 有 两 个 数 : 0 和 1, 当然 ,0 就 是 二 
进 制 里 的 第 一 个 数 了 ,所 以 嘛 ,秉承 大 这 样 的 传统 ,0 也 就 习惯 用 于 表示 第 一 个 数 。 所 以 ,正确 
的 做 法 应 该 是 : 


>>> number = [1, 2, 3, 4, 5, 6, 7, 8] 
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>>> number. insert(0, 0) 
>>> number 
[0, Li 2; 3. 4, 2 5; T5 8] 


5.1.3 从 列表 中 获取 元 素 


索引 值 是 从 0 开始 的 : 
>>> name = ['J$2E", "BE", "RUE", "AXE" ] 
>>> name[0] 
AE C 
>>> name[3] 


' 李 狗 蛋 ， 
那 按照 这 个 方法 让 * 李 狗 重 ”和 ”了 鸭 重 ”的 位 置 互 调 : 


>>> name[1], name[3] = name[3], name[1] 
>>> name 


DSE, FWE, WE, WE] 


5.1.4 从 列表 删除 元 素 


从 列表 删除 元 素 ,这 里 也 介绍 三 种 方法 : removeO del 和 pop()。 先 演示 一 下 用 removeO AH 
除 元 素 : 
>>> name. remove(" 李 狗 蛋 ") 


>>> name 

DOE, BE, WE] 

使 用 remove() 删 除 元 素 , 你 并 不 需要 知道 这 个 元 素 在 列表 中 的 具体 位 置 ,只 需要 知道 该 
元 系 存 在 列表 中 就 可 以 了 。 如 采 要 删除 的 东西 根本 不 在 列表 中 ,程序 就 会 报错 : 


>>> name. remove( " [f 85 4 " ) 
Traceback (most recent call last): 
File "< pyshelli138»", line 1, in < module» 
name. remove( " K 9 E" ) 


ValueError: list.remove(x): x not in list 


remove() 方 法 并 不 能 指定 删除 某 个 位 置 的 元 素 , 这 时 就 要 用 del 来 实现 : 


>>> del name[1] 


>>> name 

[3838 ', WHE] 

注意 ,del 是 一 个 语句 ,不 是 一 个 列表 的 方法 ,所 以 你 不 必 在 它 后 边 加 上 小 括号 ()。 另 外 ， 
如 果 你 想 删 除 整个 列表 ,还 可 以 直接 用 del 加 列表 名 删除 : 

>>> del name 

>>> name 


Traceback (most recent call last): 
File "< pyshell #142 >", line 1, in < module» 
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name 
NameError: name 'name'is not defined 


最 后 ,演示 用 popO Jr i " 98 1H "7638 : 
>>> name = ["I E", "RSS", "BE", "2E" ] 


>>> name. pop() 

EXE 

>>> name. pop( ) 

ET 

>>> name 

DSE, E] 

大 家 看 到 了 ,pop() 方 法 默认 是 弹出 列表 中 的 最 后 一 个 元 素 。 但 这 个 pop() 方 法 其 实 还 可 
以 灵活 运用 , 当 你 为 它 加 上 一 个 索引 值 作为 参数 的 时 候 , 它 会 弹出 这 个 索引 值 对 应 的 元 素 : 

>>> name = [" E", "RETE", "RÉGE", "FAE" ] 

>>> name. pop(2) 

EE 

>>> name 


[9538 ', BE, FAE] 


5.1.5 IRIRA 
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个 元 素 , 有 没有 办 法 实现 呢 ? 利用 列表 分 片 (slice) ,可 以 方便 地 实现 这 个 要 求 : 

>>> nane = [" 鸡 蛋 "，" 鸭 蛋 "，" 鹅 蛋 "，" 李 狗 蛋 "] 

>>> name[ 0:2] 

DSE, WE] 

很 简单 对 吧 ? 只 不 过 是 用 一 个 冒号 隅 开 两 个 索引 值 ,左边 是 开始 位 置 ,右边 是 结束 位 置 。 
这 里 要 注意 的 一 点 是 ,结束 位 置 上 的 元 素 是 不 包含 的 。 利 用 列表 分 片 ,得 到 一 个 原来 列表 的 拷 
贝 ,原来 列表 并 没有 发 生 改 变 。 

列表 分 片 也 可 以 简写 ,我 们 说 过 Python 就 是 以 简洁 闻名 于 世 , 所 以 你 能 想到 的 “便捷 方 
案 ”, Python 的 作者 以 及 Python 社区 的 小 伙伴 们 都 已 经 想到 了 ,并 付 诸 实践 ,你 要 做 的 就 是 验 
证 一 下 是 人 否 可 行 : 

>>> name[ :2] 

DSE, E] 

>>> name[1:] 

DEE, WE, FIE] 

>>> name[ : ] 

DEE, BE, WE, FAE] 

如 果 没有 开始 位 置 ,Python 会 默认 开始 位 置 是 0。 同样 道理 ,如 果 要 得 到 从 指定 索引 值 
到 列表 未 尾 的 所 有 元 素 , 把 结束 位 置 省 去 即 可 。 如 果 没 有 放 入 任何 索引 值 ,而 只 有 一 个 冒号 ， 
将 得 到 整个 列表 的 拷贝 。 

再 一 次 强调 : 列表 分 片 就 是 建立 原 列 表 的 一 个 拷贝 (或 者 说 副本 ), 所 以 如 果 你 想 对 列表 做 出 某 
些 修改 ,但 同时 还 想 保持 原来 的 那个 列表 ,那么 直接 使 用 分 片 的 方法 来 获取 拷贝 就 很 方便 了 。 
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5.1.6 列表 分 片 的 进 阶 玩 法 
分 片 操作 实际 上 还 可 以 接收 第 三 个 参数 ,其 代表 的 是 步 长 ,默认 情况 下 (不 指定 它 的 时 候 ) 
该 值 为 1, 来 试 试 将 其 改 成 2 会 有 什么 效果 ? 


>>> list1 = [1, 2, 3, 4, 5, 6, 7, 8, 9] 
>>> list1[0:9:2] 
[1 3 B. Ey 9] 


如 果 将 步 长 改 成 2, 那么 每 前 进 两 个 元 素 才 取 一 个 出 来 。 其 实 还 可 以 直接 写成 listl [ ::2 ]. 
如 果 步 长 的 值 是 负数 ,例如 一 1, 结 果 会 怎样 呢 ? 不 妨 试 试看 : 


>>> listi[:: -1] 
[9, 8, re 6, 2e 4, 2 A 1] 


是 不 是 很 有 意思 ? 这 里 步 长 设置 为 一 1, 就 相当 于 复制 一 个 反 转 的 列表 。 
5.1.7 ”一些 常 用 操作 符 
此 前 学 过 的 大 多 数 操作 符 都 可 以 运用 到 列表 上 : 


>>> listl = [123] 
>>> list2 = [234] 
>>> listl > list2 


False 

>>> list3 = [ 'abc'] 
>>> list4 = [ 'bcd'] 
>>> list3 < list4 
True 


我 们 发 现 列表 还 是 挺 聪明 的 , 竞 然 会 懂得 比较 大 小 。 那 如 果 列 表 中 不 止 一 个 元 素 呢 ? 结 
果 又 会 如 何 ? 


>>> listl = [123, 456] 
>>> list2 = [234, 123] 
>>> list1 > list2 

False 


怎么 会 这 样 ? listl 列表 的 和 是 123 十 456 = 二 579, 按 理应 该 比 list2 列表 的 和 234 十 123= 

357 E. 为 什么 listl 2 list2 还 会 返回 False WÈ? 

思考 片刻 后 得 出 结论 : Python 的 列表 原来 并 没有 我 们 想象 中 那么 智能”( 注 : 在 后 边 讲 
“魔法 方法 ”的 章节 会 教 大 家 如 何 把 列表 改变 得 更 加 聪明 ) , 当 列 表 包 含 多 个 元 素 的 时 候 , 默 认 
是 从 第 一 个 元 素 开 始 比 较 , 只 要 有 一 个 PK 说 了 ,就 算 整 个 列表 说 了 。 字 符 串 比较 也 是 同样 的 
道理 (字符 串 比 较 的 是 第 一 个 字符 对 应 的 ASCII 码 值 的 大 小 )。 

我 们 知道 字符 串 可 以 用 加 号 (十 ) 来 进行 拼接 ,用 乘 号 ( x* ) 来 复制 自身 奉 干 次 。 它 们 在 列 
A E pui up Sam. 

>>> listl [123, 456] 


>>> list2 = [234, 123] 
>>> list3 = listl + list2 
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>>> list3 
[123, 456, 234, 123] 


加 号 (十 ) 也 叫 连接 操作 符 , 它 允许 我 们 把 多 个 列表 对 象 合并 在 一 起 ,其 实 就 相当 于 
extend() 方 法 实现 的 效果 。 一 般 情况 下 建议 大 家 使 用 extend() 方 法 来 扩展 列表 ,因为 这 样 显 
得 更 为 规范 和 专业 。 另 外 ,连接 操作 符 并 不 能 实现 列表 添加 新 元 系 的 操作 :: 


>>> listl = [123, 456] 
>>> list2 = listl + 789 
Traceback (most recent call last): 
File "< pyshell # 177 >", line 1, in < module» 
list2 = listl + 789 
TypeError: can only concatenate list (not "int") to list 


所 以 如 果 要 添加 一 个 元 素 到 列表 中 ,用 什么 方法 ? 嗯 ,可 以 用 append O RA insert O 77 
法 ,希望 大 家 还 记得 。 乘 号 (x ) 也 叫 重 复 操作 符 ,重复 操作 符 可 以 用 于 列表 中 : 
>>> listl = [123] 


>>> listl * 3 
[123. 123, 123] 


当然 复合 赋值 运算 符 也 可 以 用 于 列表 : 


>>> listl * = 5 
>>> listl 
1123... 123. 123. 123. 123] 


另外 有 个 成 员 关 系 操 作 符 大 家 也 不 阳 生 ,我 们 是 在 谈 for 循环 的 时 候 认 识 它 的 ,成 员 关 系 
操作 符 就 是 in 和 not in! 

>>> listl = [" 小 猪 ", "小 猫 "," 小 狗 "," 小 甲鱼 "] 

>>> "小 甲鱼 " inlistl 

True 

>>> "小 护士 " not in listi 

True 


之 前 说 过 列表 里 边 可 以 包含 另 一 个 列表 ,那么 对 于 列表 中 的 列表 元 系 ,能 不 能 使 用 in 和 
not in 测试 呢 ? 试 试 便 知 : 

>>> listl = [" 小 猪 "，" 小 猫 "，[ "小 甲鱼 "，" 小 护士 "]，" 小 狗 "] 

>>> "小 甲鱼 " inlistl 

False 

>>> "小 护士 " not in listi 

True 

可 见 ,in 和 not in 只 能 判断 一 个 层次 的 成 员 关 系 , 这 跟 break 和 continue 语句 只 能 作用 于 
一 个 层次 的 循环 是 一 个 道理 。 那 要 判断 列表 里 边 的 列表 的 元 系 ,应 该 先进 入 一 层 列 表 : 

>>> "小 甲鱼 "in list1[2] 

True 


>>> "小 护士 " not in list1[2] 
False 


顺便 说 一 下 ,前 面 提 到 使 用 索引 号 去 访问 列表 中 的 值 , 那 么 对 于 列表 中 的 列表 ,应 该 如 何 访 
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问 呢 ? 
大 家 应 该 猜 到 了 ,其 实 跟 C 语言 访问 二 维 数组 的 方法 相似 ， 


>>> list1[2][0] 
' 小 甲鱼 ' 


5.1.8 列表 的 小 伙伴 们 


接 下 来 认识 一 下 列表 的 小 伙伴 们 ,那么 列表 有 多 少 小 伙伴 呢 ? 不妨 让 Python 自己 告诉 
我 们 : 


>>> dir(list) 

[' add ',' class ',' contains ', ' delattr ', ' delitem ', ' dir ',' 
_ format ',' ge ',' getattribute ', ' getitem ',' gt ',' hash _', ' iadd ',' imul 
', | init ',' iter ',' le ',' len ','" lt ',' mul ',' ne ' new ',' reduce 
', ' reduce ex '", ' repr ', ' reversed ',' rmul ',' setattr ', ' setitem ',' sizeof  ', ' 
Str ', ' subclasshook  ', 'append', 'clear', 'copy', 'count', 'extend', 'index', 'insert', 'pop', 
'remove', 'reverse', 'sort'] 

产生 了 一 个 熟悉 又 陌生 的 列表 ,很 多 熟悉 的 方法 似曾相识 ,例如 append O , extend O, 

insert, popO 、remove() 都 是 学 过 的 。 现 在 再 给 大 家 介绍 几 个 常用 的 方法 。 


count() 这 个 方法 的 作用 是 计算 它 的 参数 在 列表 中 出 现 的 次 数 : 
»»» listl = [1, 1, 2, 3, 5, 8, 13, 21] 


>>> listl.count(1) 
2 


index() 这 个 方法 会 返回 它 的 参数 在 列表 中 的 位 置 

>>> listl. index(1) 

0 

可 以 看 到 ,这 里 是 返回 第 一 个 目标 (1) 在 listl 中 的 位 置 ,index() 方 法 还 有 两 个 参数 ,用 于 
限定 查找 的 范围 。 因 此 可 以 这 样 查找 第 二 个 目标 在 listl 的 位 置 : 

>>> start = listl.index(1) + 1 

>>> stop = len(listl) 


>>> list1. index(1, start, stop) 
1 


reverse() 方 法 的 作用 是 将 整个 列表 原 地 翻转 ,就 是 排 最 后 的 放 到 最 前 边 , 排 最 前 的 放 到 
最 后 , 邦 么 排 倒数 第 二 的 就 排 在 第 二 ,以 此 类 推 : 


>>> listl = [1, 2, 3, 4, 5, 6, 7, 8] 
>>> listl.reverse() 

>>> listl 

LS; 7; 5, 5, 4, 3. X, X] 


sort() 这 个 方法 是 用 指定 的 方式 对 列表 的 成 员 进行 排序 ,默认 不 需要 参数 ,从 小 到 大 
排队 : 


>>> listl = [8, 9, 3, 5, 2, 6, 10, 1, 0] 
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>>> listl.sort() 
>>> listl 
I 1. 2. 35 5, 56, 0. 9, 30] 


那 如 果 需 要 从 大 到 小 排队 呢 ? 很 简单 , 先 调用 sort() 方 法 ,列表 会 先 从 小 到 大 排 好 队 , 然 
后 调用 reverse() 方 法 原 地 翻转 就 可 以 啦 。 

什么 ? Au? 好 吧 ,大 家 真是 越 来 越 懒 了 …… 很 好 ,大 家 离 天 才 又 近 了 一 步 ?。 其 实 ， 
sort() 这 个 方法 其 实 有 三 个 参数 ,其 形式 为 sort(func，key，reverse) 。 

func 和 key 参数 用 于 设置 排序 的 算法 和 关键 字 , 默 认 是 使 用 归并 排序 ,算法 问题 不 在 这 
里 讨论 ,有 兴趣 的 朋友 可 以 看 一 下 小 甲鱼 另 一 本 不 错 的 教程 :《 数 据 结构 和 算法 》(C 语言 )。 
这 里 要 讨论 sort() 方 法 的 第 三 个 参数 : reverse, 没 错 , 就 是 刚刚 学 的 那个 reverse() 方 法 的 那个 
reverse。 不 过 这 里 作为 sort(O) 的 一 个 默认 参数 , 它 的 默认 值 是 sort(reverse = False) ,表示 不 
颠倒 顺序 。 因 此 ,只 需要 把 False 改 为 True, 列 表 就 相当 于 从 大 到 小 排序 : 

>>> listi = [B8, 9, 3, 5, 2, 6, 10, 1, 0] 

>>> listl.sort(reverse = True) 


>>> listl 
[10, 9, a; 6, - m" K Zi 1; 0] 


5.1.9 关于 分 卢 " 拷 贝 " 概 念 的 补充 
上 一 节 提 到 使 用 分 片 创建 列表 的 拷贝 ， 


>>> listl = [1, 3, 2, 9, 7, 8] 
>>> list2 = listl[:] 

>>> list2 

[1, 3, 2.9, 7, 8] 

>>> list3 = listl 

>>> list3 

[1, 3, 2, 9, 7, 8] 


看 似 一 样 ,对 吧 ? 但 事实 上 呢 ? 利用 列表 的 一 个 小 伙伴 做 以 下 修改 ,大 家 看 看 差别 : 


>>> listl.sort() 
>>> listl 

[1, 2, 3, 7, 8, 9] 
>>> list2 

[1, 3, 2, 9, 7, 8] 
>>> list3 

[1, 2, 3, 7, 8, 9] 


可 以 看 到 listl 已 经 从 小 到 大 排 好 了 序 , 那 list2 和 list3 呢 ? 使 用 分 片 方 式 得 到 的 list2 很 有 
原则 、 很 有 格调 ,并 不 会 因为 listl 的 改变 而 改变 ,这 个 原理 我 待 会 儿 跟 大 家 说 ; KAA list3…… 
看 ,真正 的 墙头 草 是 list3. T 96 ARAS listl 改变 了 ,这 是 为 什么 呢 ? 

不 知道 大 家 还 记 不 记得 在 讲解 变量 的 时 候 说 过 ,Python 的 变量 就 像 一 个 标签 ,就 一 个 名 
字 而 已 …… 还 是 给 大 家 画 个 图 好 理解 ,如 图 5-1 所 示 。 


OD 小 甲鱼 个 人 认为 “ 懒 " 是 创新 发 明 的 根源 和 动力 。 
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um 35 25 9s 7, & | 


P 


1; 3s 2, 9, 7, & | 


图 5-1 拷贝 列表 


这 下 大 家 应 该 明日 了 吧 , 为 一 个 列表 指定 为 一 个 名 字 的 做 法 ,只 是 问 同 一 个 列表 增加 一 个 
新 的 标签 而 已 ,真正 的 拷贝 是 要 使 用 分 片 的 方法 。 这 个 也 是 初学 者 最 容易 混 消 的 地 方 , 大 家 以 
后 与 代码 时 一 定 要 注意 哦 。 


6.2 元 组 : 戴 上 了 柳 锁 的 列表 


早 在 三 百 多 年 前 , 重 德 斯 鸠 在 人 ( 论 法 的 精神 》 里 边 就 提 到 "一切 拥 有 权力 的 人 都 容易 滥用 权 
力 , 这 是 万 古 不 变 的 一 条 经 验 。" 但 是 凡是 拥有 大 权力 的 人 ,都 想 用 日 身 的 实践 证 明 重 德 斯 鸠 是 
一 个 只 会 说 屁 话 的 家 伙 , 但 是 他 们 好 像 都 失败 了 …… 

由 于 列表 过 分 强大 ,Python 的 作者 觉得 这 样 似乎 不 妥 , 于 是 发 明了 列表 的 “表亲 ”一 一 
元 组 。 

元 组 和 列表 最 大 的 区 别 就 是 你 可 以 任意 修改 列表 中 的 元 系 , 可 以 任意 插入 或 者 删除 一 个 
元 素 ,而 对 元 组 是 不 行 的 ,元 组 是 不 可 改变 的 ( 像 字 符 串 一 样 ) ,所 以 你 也 别 指望 对 元 组 进行 原 
地 排序 等 高 级 操作 了 。 


5.2.1 创建 和 访问 一 个 元 组 


元 组 和 列表 ,除了 不 可 改变 这 个 显著 特征 之 外 ,还 有 一 个 明显 的 区 别 是 ,创建 列表 用 的 是 
中 括号 ,而 创建 元 组 大 部 分 时 候 用 的 是 小 括号 (注意 ,我 这 里 说 的 是 大 部 分 ) 


>>> tuplel = (1, 2, 3, 4, 5, 6, 7, 8) 
>>> tuplel 
Li 2; 3 4, 2; 6, T; 8) 


访问 元 组 的 方式 与 列表 无 异 : 


>>> tuplel[1] 
2 

>>> tuplel[5:] 
(6, 7, 8) 

>>> tuplel[:5] 
(1, 2, 3, 4, 5) 


也 使 用 分 片 的 方式 来 复制 一 个 元 组 : 


>>> tuple2 = tuplel[:] 
>>> tuple2 
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(1, 2, 3, 4, 5, 6, 7, 8) 
如 果 你 试图 修改 元 组 的 一 个 元 素 ,那么 抱歉 ,Python 会 很 不 开心 ， 


>>> tuplel[1] = 1 
Traceback (most recent call last): 
File "< pyshell # 7>", line 1, in «module» 
tuplel[1] = 1 
TypeError: 'tuple' object does not support item assignment 


我 很 好 奇 如 果 问 你 ,列表 的 标志 性 符号 是 中 括号 ([]) ,那么 元 组 的 标志 性 符号 是 什么 ”你 
会 怎么 回答 呢 ? 

小 甲鱼 相信 上 百 分 之 九 十 的 朋友 都 会 不 假 思 索 地 回答 : 小 括号 啊 , 有 部 分 比较 激进 的 朋友 
还 可 能 会 补充 一 句 “ 小 甲鱼 你 傻 啊 ?” 

好 吧 , 这 个 问题 其 实 也 是 大 部 分 初学 者 所 忽略 和 容易 上 当 的 ,我 们 实验 一 下 : 

>>> temp = (1) 

>>> type(tenmp) 

«class 'int'> 

还 记得 typeO Zr iE lE ,作用 是 返回 参数 的 类 型 ,这 里 它 返 回 说 temp 变量 是 整 型 (int)。 再 
试 试 : 

>>> temp = 1,2, 3 


>>> type(temp) 
«class 'tuple'» 


噢 ,发 现 了 吧 ? 就 算 没有 小 括号 ,temp 还 是 元 组 类 型 ,所 以 逗号 (,) 才 是 关键 ,小 括号 只 是 
起 到 补充 的 作用 。 但 是 你 如 果 想 要 创建 一 个 空 元 组 ,那么 你 就 直接 使 用 小 括号 即 可 : 


>>> temp = () 
>>> type(temp) 
«class 'tuple> 


所 以 这 里 要 注意 的 是 ,如 果 要 创建 的 元 组 中 只 有 一 个 元 素 , 请 在 它 后 边 加 上 一 个 逗号 (,)， 
这 样 可 以 明确 告诉 Python 你 要 的 是 一 个 元 组 ,不 要 拿 什 么 整 型 . 浮 点 型 来 忽悠 你 : 


>>> templ - (1) 
>>> type(templ) 
«class 'int'» 

>>> temp2 = (1, ) 
>>> type(temp2) 

< class 'tuple' 
>>> temp3 = 1, 
>>> type(temp3) 

< class 'tuple' 


为 了 证 明 逗 号 (,) 起 到 了 决定 性 作用 ,再 给 大 家 举 个 例子 : 


>>> 8 * (8) 

64 

>>>8 * (8,) 

(8, 8, 8, 8, 8, 8, 8, 8) 
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5.2.2 更 新 和 删除 元 组 


有 朋友 可 能 会 说 ,刚才 不 是 你 自己 说 “元 组 是 板 上 钉 钉 不 能 修改 的 吗 ”? 你 现在 又 来 谈 更 
新 一 个 元 组 ,小 甲鱼 你 这 不 是 目 己 打 脸 吗 ? 

大 家 不 要 激动 …… 我 们 只 是 讨论 一 个 相对 含蓄 的 做 法 (直接 在 同一 个 元 组 上 更 新 是 不 可 
行 的 ,除非 你 学 习 了 后 边 的 “魔法 方法 ?章节 )。 不 知道 大 家 还 记 不 记得 以 前 是 如 何 更 新 一 个 字 
符 串 的 ? 没 错 , 是 通过 拷贝 现 有 的 字符 串 片 段 构 造 一 个 新 的 字符 串 的 方式 解决 的 ,对 元 组 也 是 
使 用 同样 的 方法 : 

>>> temp = (" 小 鸡 "，" 小 鸭 "，" 小 猪 ") 

>>> temp = temp[:2] + ("小 甲鱼 ",) + temp[2:] 

>>> temp 

(小 鸡 '，' 小 鸭 "，' 小 甲鱼 '，' 小 猪 ") 

上 面 的 代码 需要 在 “小 鸭 ? 和 "小 猪 " 中 间 插入 * 小 甲鱼 ", 那 么 通过 分 片 的 方法 让 元 组 拆 分 
为 两 部 分 ,然后 再 使 用 连接 操作 符 ( 十 ) 合 并 成 一 个 新 元 组 ,最 后 将 原来 的 变量 名 (temp) 指 问 
连接 好 的 新 元 组 。 不 妨 可 以 把 这 样 的 做 法 称 为 "狸猫 换 太子 ”。 在 这 里 就 要 注意 了 ,逗号 是 必 
需 的 ,小 括号 也 是 必需 的 ! 

在 谈 到 列表 的 时 候 , 小 甲鱼 跟 大 家 说 有 三 个 方法 可 以 删除 列表 里 边 的 元 对 ,但 是 对 于 元 组 
是 不 可 变 的 原则 来 说 ,单独 删除 一 个 元 素 是 不 可 能 的 ,当然 你 可 以 用 刚才 小 甲鱼 教 给 大 家 更 新 
元 组 的 方法 ,间接 地 删除 一 个 元 系 : 

>>> temp = temp[:2] + temp[3:] 


>>> temp 

(' 小 鸡 '，' 小 鸭 '，' 小 猪 ") 

如 果 要 删除 整个 元 组 ,只 要 使 用 del 语句 即 可 显 式 地 删除 一 个 元 组 : 

>>> del temp 

>>> temp 

Traceback (most recent call last): 

File "< pyshell # 30>", line 1, in < module» 
temp 

NameError: name 'temp'is not defined 

其 实在 日 常 使 用 中 ,很 少 使 用 del 去 删除 整个 元 组 ,因为 Python 的 回收 机 制 会 在 这 个 元 
组 不 再 被 使 用 到 的 时 候 目 动 删除 。 

最 后 小 结 一 下 哪些 操作 符 可 以 使 用 在 元 组 上 ,拼接 操作 符 和 重复 操作 符 刚 刚 演示 过 了 , 关 
系 操 作 符 ,逻辑 操作 符 和 成 员 关 系 操 作 符 in 和 not in 也 可 以 直接 应 用 在 元 组 上 ,这 跟 列 表 是 
一 样 的 ,大 家 自己 实践 一 下 就 知道 了 。 关 于 列表 和 元 组 ,我们 今后 会 谈 得 更 多 ,目前 ,就 先 聊 到 
这 里 。 


6.3 - II. 


或 许 现在 又 回 过 头 来 谈 字 符 串 ,有 些 朋 友 可 能 会 觉得 没 必要 。 
其 实 关 于 字符 串 , 还 有 很 多 你 可 能 不 知道 的 秘密 ,由 于 字符 串 在 日 常 使 用 中 是 如 此 常见 ， 
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因此 小 甲鱼 抱 铸 负责 任 的 态度 在 本 节 把 所 知道 的 都 倒 出 来 跟 大 家 分 享 一 下 。 

关于 创建 和 访问 字符 串 ,前 面 已 经 介绍 过 了 。 不 过 学 了 列表 和 元 组 ,我 们 知道 了 分 片 的 概 
念 ,事实 上 也 可 以 应 用 于 字符 串 之 上 : 

>>> strl = "I love fishc. com!" 


>>> strl[:6] 
'I love' 


接触 过 C 语言 的 朋友 应 该 知道 ,在 C 语言 中 ,字符 串 和 字符 是 两 个 不 同 的 概念 CC 语言 
单 引 号 表示 字符 , 双 引 号 表示 字符 串 )。 但 在 Python 并 没有 字符 这 个 类 型 ,在 Python 看 来 ， 
所 谓 字 符 ,就 是 长 度 为 1 的 字符 串 。 当 要 访问 字符 串 的 其 中 一 个 字符 的 时 候 , 只 需 用 索引 列表 
或 元 组 的 方法 来 索引 字符 串 即 可 : 

>>> strl[5] 

字符 串 跟 元 组 一 样 ,都 是 属于 "一 言 既 出 、 骆 马 难 追 ?的 家 伙 。 所 以 一 旦 定 下 来 就 不 能 直接 
对 它们 进行 修改 了 ,如 果 必 须要 修改 ,我们 就 需要 委 曲 求全 …… 

>>> strl[:6] + " AWZ" + str1[6:] 

'I love 插入 的 字符 串 fishc. com! ' 

但 是 大 家 要 注意 ,这 种 通过 拼接 旧 字 符 串 的 各 个 部 分 得 到 新 字符 串 的 方式 并 不 是 真正 意 
义 上 的 改变 原始 字符 串 ,原来 的 那个 “家 伙 ? 还 在 ,只 是 将 变量 指 回 了 新 的 字符 串 ( 旧 的 字符 串 
一 旦 失去 了 变量 的 引用 ,就 会 被 Python 的 垃圾 回收 机 制 释放 掉 )。 

像 比较 操作 符 .逻辑 操作 符 、 成 员 关 系 操 作 符 等 的 操作 跟 列 表 和 元 组 是 一 样 的 ,这 里 就 不 
HIFR S. 


5.3.1 各 种 内 置 方法 


列表 和 元 组 都 有 它们 的 方法 ,大 家 可 能 觉得 列表 的 方法 已 经 非常 多 了 ,其 实 字 符 串 更 多 
呢 。 表 5-1 总 结 了 字符 串 的 所 有 方法 及 对 应 的 含义 。 


X 5-1 Python 字符 串 的 方法 


方 法 £ x 
capitalize() 把 字符 串 的 第 一 个 字符 改 为 大 写 
casefold() 把 整个 字符 串 的 所 有 字符 改 为 小 写 
center( width) 将 字符 串 居中 ,并 使 用 空格 填充 至 长 度 width 的 新 字符 串 
count(sub[ , start[ , end] ]) 返回 sub 在 字符 串 里 边 出 现 的 次 数 ,start 和 end 参数 表示 范围 ,可 选 


ing= 'utf-8', errors=' 
encodeCencoding— "ut, errors | v cncoding 指定 的 编码 格式 对 字符 串 进 行 编码 


检查 字符 串 是 否 以 sub 子 字 符 串 结束 ,如 果 是 返回 True, 和 否则 返回 
False. start 和 end 参数 表示 范围 ,可 选 

把 字符 串 中 的 tab 符号 (\t) 转 换 为 空格 ,如 不 指定 参数 ,默认 的 空格 数 
是 tabsize— 8 

检测 sub 是 否 包 含 在 字符 串 中 ,如 果 有 则 返回 索引 值 ,否则 返回 一 1， 
start 和 end 参数 表示 范围 ,可 选 


strict') 


endswith(sub[ . start[ , end] D 


expandtabs([ tabsize— 8 ]) 


find(sub[ , start[ , end] ]) 
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5 法 
index(Csub[L ，startL ，end ]]) 


isalaum() 


isalpha 


isdecimal() 


isdigit() 
islower( ) 


isnumeric() 


isspace() 


istitle( ) 


Isupper() 


joinCsub) 
ljustCwidth) 
lower() 


lstrip() 


partition( sub) 


replaceCold, new[ , count ]) 


rfindCsub[ , start[ . end] ]) 
rindex(sub[ . start[ , end] ]) 
rjustC width) 

rpartition( sub) 


rstrip() 


split(sep= None, maxsplit= — 1) 


splitlinesCC[ keepends D) 


startswith(prefix[ , start[ , end] ]) 


strip([ chars ]) 


swapcase() 


titleC) 
translate(Ctable) 


upper() 
zfill width) 
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续 表 

含 X 
ER find 方法 一 样 ,不 过 如 果 sub 不 在 string 中 会 产生 一 个 异常 
如 果 字 符 串 至 少 有 一 个 字符 并 且 所 有 字符 都 是 字母 或 数字 则 返回 
True, 否 则 返回 False 
如 果 字 符 串 至 少 有 一 个 字符 并 且 所 有 字符 都 是 字母 则 返回 True, 和 否则 
返回 False 
如 果 字 符 串 只 包含 十 进 制 数字 则 返回 True, 和 否则 返回 False 
如 果 字 符 串 只 包含 数字 则 返回 True, 和 否则 返回 False 
如 果 字 符 串 中 至 少 包 含 一 个 区 分 大 小 写 的 字符 ,并 且 这 些 字 符 都 是 小 
tj , 则 返回 True, 否 则 返回 False 
如 果 字 符 串 中 只 包含 数字 字符 , 则 返回 True, 否 则 返回 False 
如 果 字 符 串 中 只 包含 空格 , 则 返回 True, 否 则 返回 False 
如 果 字 符 串 是 标题 化 (所 有 的 单词 都 是 以 大 写 开 始 , 其余 字 母 均 小 
写 ), 则 返回 True, 否 则 返回 False 
如 果 字 符 串 中 至 少 包含 一 个 区 分 大 小 写 的 字符 ,并 且 这 些 字 符 都 是 大 
tj , 则 返回 True, 否 则 返回 False 
以 字符 串 作 为 分 隔 符 ,插入 到 sub 中 所 有 的 字符 之 间 
返回 一 个 左 对 齐 的 字符 串 ,并 使 用 空格 填充 至 长 度 为 width 的 新 字符 串 
转换 字符 串 中 所 有 大 写字 符 为 小 写 
去 掉 字 符 串 左边 的 所 有 空格 
找到 子 字 符 串 sub, 把 字符 串 分 成 一 个 3 元 组 (pre_sub, sub, fol sub), 
如 果 字 符 串 中 不 包含 sub 则 返回 (' 原 字符 串 ','',，'') 
把 字符 串 中 的 old 子 字 符 串 替换 成 new 子 字 符 串 ,如果 count 指定 , 则 
替换 不 超过 count 次 
类 似 于 find() 方 法 ,不 过 是 从 右边 开始 查找 
类 似 于 index() 方 法 ,不 过 是 从 右边 开始 查找 
返回 一 个 右 对 齐 的 字符 串 ,并 使 用 空格 填充 至 长 度 为 width 的 新 字符 串 
类 似 于 partition() 方 法 ,不 过 是 从 右边 开始 查找 
删除 字符 串 末 尾 的 空格 
不 带 参数 默认 是 以 空格 为 分 隔 符 切片 字符 串 ,如 果 maxsplit 参数 有 设 
置 , 则 仅 分 隔 maxsplit 个 子 字 符 串 ,返回 切片 后 的 子 字 符 串 拼接 的 列表 
按照 \n' 分 隔 , 返 回 一 个 包含 各 行 作 为 元 素 的 列表 ,如 果 keepends 参数 
指定 , 则 返回 前 keepends fT 
检查 字符 串 是 否 以 prefix 开头 ,是 则 返回 True, 和 否则 返回 False, start 
和 end 参数 可 以 指定 范围 检查 ,可 选 
删除 字符 串 前 边 和 后 边 所 有 的 空格 ,chars 参数 可 以 定制 删除 的 字符 ， 
可 选 
翻转 字符 串 中 的 大 小 写 
返回 标题 化 (所 有 的 单词 都 是 以 大 写 开始 ,其 余 字 母 均 小 写 ) 的 字符 串 
根据 table 的 规则 (可 以 由 str. maketrans('a'"，'b') 定 制 ) 转 换 字符 串 中 
的 字符 
转换 字符 串 中 的 所 有 小 写字 符 为 大 写 
返回 长 度 为 width 的 字符 串 , 原 字 符 串 右 对 齐 ,前 边 用 0 填充 。 
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这 里 选 几 个 常用 的 给 大 家 演示 一 下 用 法 ,首先 是 casefold() 方 法 , 它 的 作用 是 将 字符 串 的 
所 有 字符 变 为 小 写 : 


>>> stri = "FishC" 
>>> strl.casefold() 
'£ishc' 


count(sub[ . start|, end] DJr ik Bii fF ,就 是 查找 sub 子 字符 串 出 现 的 次 数 , 可 选 参 
数 ( 注 : 在 Python 文档 中 ,用 方 括号 ([L]) 括 起 来 表示 为 可 选 )start 和 end 表示 查找 的 范围 : 


>>> Strl = "AbcABCabCabcABCabc" 
>>> strl.count( 'ab', 0, 15) 
2 


如 果 要 查找 某 个 子 字 符 串 在 该 字符 串 中 的 位 置 , 可 以 使 用 findGsub|. start|, end ] D zX 
indexCsub| ，startL ，endj]]) 方 法 。 如 果 找 到 了 , 则 返回 值 是 第 一 个 字符 的 索引 值 ; 如 果 找 不 
到 , 则 find() 方 法 会 返回 一 1, 而 index() 方 法 会 抛 出 异常 ( 注 : 异常 是 可 以 被 捕获 并 人 处理 的 错 
误 , 目 前 你 可 以 认为 就 是 错误 ): 


>>> strl = "I love fishc.com" 

>>> strl.find("fishc") 

- 

>>> strl.find("good") 

E 

>>> strl.index("fishc") 

E 

>>> strl.index("good") 

Traceback (most recent call last): 

File "< pyshell£12»", line 1, in < module» 

strl. index( "good" ) 

ValueError: substring not found 


今后 你 可 能 会 在 很 多 文档 中 看 到 join(Csub) 的 身影 ,程序 员 嘉 欢 用 它 来 连接 字符 串 LIBE 
的 用 法 也 许 会 让 你 感到 证 异 。join 是 以 字符 串 作 为 分 隅 符 ,插入 到 sub 字符 串 中 所 有 的 字符 
之 间 : 

>>> 'x'.join("Test") 

"Ixexsxt' 

>>> ' '. join("FishC") 

F ishC 

为 什么 说 “程序 员 喜 欢 用 join() 来 连接 字符 串 ”, 我 们 不 是 有 很 好 用 的 连接 符号 (十 ) 吗 ? 
这 是 因为 当 使 用 连接 符号 (十 ) 去 拼接 大 量 的 字符 串 时 是 非常 低 效率 的 ,因为 加 号 连接 会 引起 
内 存 复制 以 及 垃圾 回收 操作 。 所 以 对 于 大 量 的 字符 串 拼 接 来 说 ,使 用 join() 方 法 的 效率 要 高 
一 些 : 

>>> 'I' + '' + o Clove' '' + Cfishc.com' 

'I love fishc.com' 

>>> ''.join(['I', 'love', 'fishc.com']) 


'] love fishc.com' 
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replace(old, new[ ，countj) 方 法 如 其 名 ,就 是 蔡 换 指 定 的 字符 串 : 


>>> strl = "I love you" 
>>> strl.replace("you", "fishc. com") 
'I love fishc.com' 


split(sep— None. maxsplit—-1)3R join() 正 好 相反 ,splitC) 用 于 拆 分 字符 串 ， 


>>> strl = ''.join(['I', 'love', 'fishc.com']) 
>>> strl 

'I love fishc.com' 

>>> strl.split() 

['I', love', 'fishc.com'] 

>>> str2 = ' '.join("FishC") 

>>> str2.split(sep- ' ') 

[35 15 95 95 99 


5.3.2 1&xX44 


前 面 介绍 了 Python 字符 串 大 部 分 方法 的 使 用 ,但 唯 独 漏 了 一 个 format O 27 [aja 
法 。 因 为 小 甲鱼 觉得 formatO 〇 方法 跟 本 节 的 话题 如 出 一 卉 ,都 是 关于 字符 串 的 格式 化 ,所 以 
放 一 块 来 讲解 。 

那 什么 是 字符 串 的 格式 化 ,又 为 什么 需要 对 字符 串 进行 格式 化 呢 ? 举 个 小 例子 给 大 家 听 : 
某 天 小 甲鱼 召开 了 鱼 C 国际 互联 安全 大 会 ,到 会 的 朋友 有 来 自 世 界 各 地 的 各 界 精英 人 士 , 有 
小 乌龟 . 噶 星 人 、 旺 星人 ,当然 还 有 米奇 和 唐 老 鸭 。 哇 唆 , 那 气势 简直 跟 小 甲鱼 开 了 个 动物 园 一 
样 …… 但 是 问题 来 了 ,大 家 交流 起 来 简直 是 鸡 同 鸭 讲 ,不 知 所 云 ! 但 是 最 后 聪明 的 小 甲鱼 还 是 
把 问题 给 解决 了 ,其 实 也 很 简单 ,各界 都 找 一 个 翻译 就 行 了 ,统一 都 翻译 成 普通 话 ,那么 问题 就 
解决 了 …… 最 后 我 们 这 个 大 会 当然 取得 了 卓越 的 成 功 并 记 入 了 吉 尼 斯 动物 大 全 。 举 这 个 例子 
就 是 想 跟 大 家 说 ,格式 化 字符 串 , 就 是 按照 统一 的 规格 去 输出 一 个 字符 串 。 如 果 规 格 不 统一 ， 
就 很 可 能 造成 误会 ,例如 十 六 进 制 的 10 跟 十 进 制 的 10 或 二 进 制 的 10 完全 是 不 同 的 概念 (十 
六 进 制 10 等 于 十 进 制 16 ,二 进 制 10 等 于 十 进 制 2) 。 字 符 串 格式 化 , 正 是 帮助 我 们 纠正 并 规 
范 这 类 问题 而 存在 的 。 


1. format( ) 


format() 方 法 接受 位 置 参 数 和 关键 字 参 数 ( 位 置 参 数 和 关键 字 参 数 在 函数 草 节 有 详细 讲 
解 ) ,二 者 均 传 递 到 一 个 叫 作 replacement 字段 。 而 这 个 replacement 字段 在 字符 串 内 由 大 括 
号 ({)) 表 示 。 先 看 一 个 例子 : 

>>> "(0) love {1}.{2}".format("I", "FishC", "com") 

'I love FishC. com' 

怎么 回 事 呢 ? 人 和 仔细 看 ,字符 串 中 的 {0}、{1} 和 {2}) 应 该 跟 位 置 有 关 , 依 次 被 format O 的 三 
个 参数 蔡 换 ,那么 format() 的 三 个 参数 就 叫 作 位置 参 数 。 那 什么 是 关键 字 参 数 呢 ,再 来 看 一 
个 例子 : 


>>> "(a) love {b}.{c}".format(a= "I", b= "FishC", c= "com") 


'] love FishC. com' 
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-a 


ta) (by 和 {c} 就 相当 于 三 个 标签 ,format() 将 参数 中 等 值 的 字符 串 蔡 换 进 去 ,这 就 是 关键 
字 参 数 啦 。 另 外 ,你 也 可 以 综合 位 置 参 数 和 关键 字 参 数 在 一 起 使 用 : 

>>> "[0) love {b}.{c}”. format(" I", b= "FishC", c= "com") 

'I love FishC. com' 

但 要 注意 的 是 ,如 条 将 位 置 参 数 和 关键 字 参 数 综合 在 一 起 使 用 ,那么 位 置 参数 必须 在 关键 
字 参 数 之 前 ,否则 就 会 出 钳 : 

>>> "{a} love (b). (0]". format(a- "I", b= "FishC", "com") 

SyntaxError: non - keyword arg after keyword arg 

如 有 果 要 把 大 括号 打印 出 来 ,你 有 办 法 吗 ? 没 错 , 这 跟 字 符 串 转 义 字符 有 点 像 , 只 需要 用 多 
一 层 大 括号 包 起 来 即 可 (要 打印 转 义 字符 (\) ,只 需 用 转 义 字符 转 义 本 身 (\\) ) : 

>>> "{{10}}" .format(" 不 打印 ") 

'(0)' 

位 置 参 数 “ 不 打印 ?没有 被 输出 ,这 是 因为 10} 的 特殊 功能 被 外 层 的 大 括号 ({) 和 剥夺 ,因此 
没有 字段 可 以 和 输出。 注意, 这 并 不 会 产生 销 误 哦 。 最 后 来 看 必 一 个 例子 : 

>>> "(0): {1:.2f}".format(" 圆 周 率 "，3.14159) 

' 圆 周 率 : 3.14' 

可 以 看 到 ,位 置 参 数 {1}) 跟 平常 有 些 不 同 ,后 边 多 了 个 冒号 。 在 蔡 换 域 中 ,冒号 表示 格式 化 
符号 的 开始 ,“.2” 的 意思 是 四 舍 五 入 到 保留 两 位 小 数 点 ,而 {的 意思 是 浮 点 数 , 所 以 按照 格式 
化 符号 的 要 求 打印 出 了 3.14, 

2. 格式 化 操作 符 : % 

刚才 讲 的 是 字符 串 的 格式 化 方法 ,现在 来 谈 谈 字符 串 所 独 盏 的 一 个 操作 符 : %, 有 人 说 ， 
这 不 是 求 余 数 的 操作 符 吗 ? 是 的 , 没 错 。 当 % 的 左右 均 为 数字 的 时 候 , 那 么 它 表示 求 余 数 的 操 
作 ; 但 当 它 出 现在 字符 中 的 时 候 , 它 表示 的 是 格式 化 操作 符 。 表 5-2 列举 了 Python 的 格式 化 
符号 及 含义 。 

表 5-2 Python 格式 化 符号 及 含义 


符 号 € X 
%e 格式 化 字符 及 其 ASCII 码 
%s 格式 化 字符 串 
%d 格式 化 整数 
%o 格式 化 无 符号 八进制 数 
%x 格式 化 无 符号 十 六 进 制 数 
%X 格式 化 无 符号 十 六 进 制 数 (大 写 ) 
%f 格式 化 浮 点 数字 ,可 指定 小 数 点 后 的 精度 
%e 用 科学 计数 法 格式 化 浮 点 数 
%E 作用 同 %e, 用 科学 计数 法 格式 化 浮 点 数 
6g 根据 值 的 大 小 决定 使 用 %f 或 %e 
%G 作用 同 %‰g, 根 据 值 的 大 小 决定 使 用 %f 或 %E 
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下 面 给 大 家 举 几 个 例子 参考 : 


>>> '%c' 97 

a' 

>> '%cyc%yc%c%c'% (70, 105, 115, 104, 67) 

'FishC' 

>>> ' 名 d 转换 为 八进制 是 : %o' % (123, 123) 

'123 转换 为 八进制 是 : 173， 

>> '% 工 用 科学 计数 法 表示 为 : &e'* (149500000, 149500000) 
'149500000. 000000 用 科学 计数 法 表示 为 : 1.495000e + 08" 


Python 还 提供 了 格式 化 操作 符 的 辅助 指令 ,如 表 5-3 Bran 
表 5-3 格式 化 操作 符 的 辅助 指令 


F S * X 
m.n m 是 显示 的 最 小 总 宽度 ,n 是 小 数 点 后 的 位 数 
- 结果 左 对 齐 
在 正 数 前 面 显示 加 号 (十 ) 
# 在 八进制 数 前 面 显示 '0o', 在 十 六 进 制 数 前 面 显示 '0x64 ' 2X, '0X64' 
0 显示 的 数字 前 面 填充 '0' 代 替 空 格 


同样 给 大 家 举 几 个 例子 供 参考 : 


>>> '£$5.1f' % 27.658 
e y ud 

>>> '% .2e' % 27.658 
'2.771e * 01" 

>>> '£$10d'$& 5 

'5' 

>>> '% —10d'* 5 

'5 ， 

>>> '% 010d' % 5 
'0000000005' 

>>> '% #X'% 100 
'0X64' 


3. Python 的 转 义 字符 及 含义 


Python 的 部 分 转 义 字符 已 经 使 用 了 一 段 时 间 ,是 时 候 来 给 它 做 个 总 结 了 , 见 表 5-4。 
表 5-4 转 义 字符 及 含义 

V |. ug | Vw | Bf 

V | 双 引 号 | WM | HC 

Va 八进制 数 代表 的 字符 
M 十 六 进 制 数 代表 的 字符 
\n 表示 一 个 空 字符 

M 横向 制 表 符 (TAB) | \ | AM 

Ww 纵向 制 表 符 S | | 
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6.4 序列 
OFT 


聪明 的 你 可 能 已 经 发 现 , 小 甲鱼 把 列表 、 元 组 和 字符 串 放 在 一 块 儿 来 讲解 是 有 道理 的 
为 它们 之 间 有 很 多 共同 点 : 

。 bu] LGB ESSERE SIRE T OA. 

。 默认 索引 值 总 是 从 0 开始 (当然 灵活 的 Python 还 文 持 负数 索引 ) 。 

。 可 以 通过 分 片 的 方法 得 到 一 个 范围 内 的 元 系 的 集合 。 

。 有 很 多 共同 的 操作 符 ( 重 复 操作 符 、 拼 接 操作 符 、 成 员 关 系 操作 符 )。 

我 们 把 它们 统称 为 : 序列 ! 下 面 介绍 一 些 关 于 序列 的 常用 BIF( 内 建 方 法 )。 


1. list(| iterable |) 


list OJr ik HT 4E — P n] 3: OGE 8 JP 7S 90] de . AR E JI Ac tee Wr p" Rx T ig. fH H 4e 
让 你 解释 的 时 候 , 很 多 朋友 就 含糊 其 词 了 : Ef VEU for 循环 嘛 …… 

这 里 小 甲鱼 帮 大 家 科普 一 下 : 所 谓 迭 代 , 是 重复 反馈 过 程 的 活动 ,其 目的 通常 是 为 了 接近 
并 到 达 所 需 的 目标 或 结果 。 每 一 次 对 过 程 的 重复 被 称 为 一 次 “ 碗 代 ”, 而 每 一 次 迭代 得 到 的 结 
果 会 被 用 来 作为 下 一 次 迭代 的 初始 值 …… 就 目前 来 说 ,迭代 还 就 是 一 个 for 循环 ,但 今后 会 介 
2 $133 fV ae ,那个 功能 , 那 叫 一 个 恢 艳 ! 

好 了 ,这 里 说 list() 方 法 要 么 不 带 参 数 , 要 么 市 一 个 可 迭代 对 象 作为 参数 ,而 这 个 序列 天 
生 就 是 可 迭代 对 象 ( 迁 代 这 个 概念 实际 上 就 是 从 序列 中 泛 化 而 来 的 ) 。 还 是 通过 几 个 例子 给 大 
家 讲解 吧 : 

>> 上 # 创建 一 个 空 列表 

>>>a = list() 

>>>a 


[] 

>>> E 将 字符 串 的 每 个 字符 迭代 存放 到 列表 中 
>>>b = list("FishC") 

>>> þ 

pis us ue c 4 

>> # 将 元 组 中 的 每 个 元 素 迭 代 存 放 到 列表 中 


>>>c = list((1, 1, 2, 3, 5, 8, 13)) 
>>> c 
I1, 1. A E 5, B.. 14] 


事实 上 这 个 list() 方 法 大 家 目 己 也 可 以 动手 实现 对 不 对 ? 很 简单 嘛 ,实现 过 程 大 概 就 是 
新 建 一 个 列表 ,然后 循环 通过 索引 夫 代 参数 的 每 一 个 元 素 并 加 入 列表 , 友 代 完毕 后 返回 列表 即 
可 。 大 家 课 后 不 妨 目 己 动 动手 来 尝试 一 下 。 


2. tuple(Literable |) 

tuple() 方 法 用 于 把 一 个 可 迭代 对 象 转换 为 元 组 ,具体 的 用 法 和 listO — FE 3x HUS IE DE, 
3. strCobp) 

str() 方 法 用 于 把 obj 对 和 象 转 换 为 字符 串 ,这 个 方法 在 前 面 结合 int() 和 {float() 方 法 给 大 家 
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讲 过 ,还 记得 吧 ? 
4. len(sub) 


len() 方 法 用 于 返回 sub 参数 的 长 度 : 


>>> strl = "I love fishc. com" 

>>> len(strl) 

16 

==> listi = [1; 1; 2; 3; 5, B. 13] 

>>> len(listl) 

- 

>>> tuplel = "ix", "Æ", "—", "个 ", "元 组 " 
>>> len(tuplel) 

5 


5. max(…) 


max() 方 法 用 于 返回 序列 或 者 参数 集合 中 的 最 大 值 , 也 就 是 说 ,max() 的 参数 可 以 是 一 个 
序列 ,返回 值 是 该 序列 中 的 最 大 值 ; 也 可 以 是 多 个 参数 ,那么 max() 将 返回 这 些 参数 中 最 大 的 


一 个 : 


>>> listl = [1, 18, 13, 0, - 98, 34, 54, 76, 32] 
>>> max(listl) 

76 

>>> strl = "I love fishc. com" 

>>> max(strl) 

v 

>>> max(5, 8, 1, 13, 5, 29, 10, 7) 

29 


6. min(… ) 


minO Jr iE iR max() 用 法 一 样 ,但 效果 相反 : 返回 序列 或 者 参数 集合 中 的 最 小 值 。 这 里 需 
要 注意 的 是 ,使 用 max() 方 法 和 min() 方 法 都 要 保证 序列 或 参数 的 数据 类 型 统一 ,否则 会 


>>> listl = [1, 18, 13, 0, - 98, 34, 54, 76, 32] 
>>> listl.append("x") 
>>> max(listl) 
Traceback (most recent call last): 
File "< pyshell # 22>", line 1, in «module» 
max(listl) 
TypeError: unorderable types: str() » int() 
>>> min(123, 'oo', 456, 'xx') 
Traceback (most recent call last): 
File "< pyshell # 23>", line 1, in < module» 
min(123, 'oo', 456, 'xx') 
TypeError: unorderable types: str() « int() 


人 家 说 : 外 行 看 热闹 ,内 行 看 门道 。 分 析 一 下 这 个 错误 信息 。Python 这 里 说 “TypeError ; 
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unorderable types: str() > int()”, 意 思 是 说 不 能 拿 字 符 串 和 整 型 进行 比较 。 这 说 明了 什 
么 呢 ? 

你 看 ,str() > int ,说 明 max() 方 法 和 min() 方 法 的 内 部 实现 事实 上 类 似 于 之 前 提 到 
的 ,通过 索引 得 到 每 一 个 元 素 , 然 后 将 各 个 元 素 进 行 对 比 。 所 以 不 妨 根据 猜想 写 出 可 能 的 
代码 : 


# 猜想 下 max(tuplel) 的 实现 方式 
temp = tuplel[0] 


for each in tuplel: 
if each > temp: 
temp - each 


return temp 


由 此 可 见 , Python 的 内 置 方 法 其 实 也 没 喻 了 不 起 的 ,有 些 我 们 也 可 以 日 己 实现 ,对 吧 ? 所 
以 只 要 认真 跟着 本 书 的 内 容 学 习 下 去 ,很 多 看 似 如 狼 似 虎 的 问题 ,将 来 都 能 迎刃而解 ! 


7. sum(iterable| . start |) 


sum() 方 法 用 于 返回 序列 iterable 的 总 和 ,用 法 跟 max O fll minO — FÉ, fH sum() 方 法 有 
一 个 可 选 参数 (start) ,如 果 设 置 该 参数 ,表示 从 该 值 开 始 加 起 ,默认 值 是 0: 


>>> tuplel = 1, 2, 3, 4, 5 
>>> sum(tuplel) 

15 

>>> sum(tuplel, 10) 

29 


8. sorted(iterable, key = None. reverse = False) 


sorted() 方 法 用 于 返回 一 个 排序 的 列表 ,大 家 还 记得 列表 的 内 建 方法 sort() 吗 ? 它们 的 
实现 效果 一 致 ,但 列表 的 内 建 方 法 sort() 是 实现 列表 原 地 排序 ; 而 sorted() 是 返回 一 个 排序 后 
的 新 列表 。 


>>> listl = [1, 18, 13, 0, - 98, 34, 54, 76, 32] 
>>> list2 = listl[:] 

>>> listl.sort() 

>>> listl 

[ - 98, 0, 1, 13, 18, 32, 34, 54, 76] 

>>> sorted(list2) 

[ - 98, 0, 1, 13, 18, 32, 34, 54, 76] 

>>> list2 

[1, 18, 13, 0, —98, 34, 54, 76, 32] 


9. reversed( sequence) 


reversed() 方 法 用 于 返回 逆 问 迭代 序列 的 值 。 同 样 的 道理 ,实现 效果 跟 列 表 的 内 建 方法 
reverse() 一 致 。 区 别 是 列表 的 内 建 方法 是 原 地 翻转 ,而 reversed() 是 返回 一 个 翻转 后 的 迭代 
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>>> listl = [1, 18, 13, 0, - 98, 34, 54, 76, 32] 
>>> reversed(listl) 
«list reverseiterator object at 0x000000000324F518 > 
>>> for each in reversed(listl): 
print(each, end- ',') 


32,776,54,34, —98,0,13,18,1, 


10. enumeratec( iterable) 


enumerate() 方 法 生成 由 二 元 组 (二 元 组 就 是 元 素数 量 为 二 的 元 组 ) 构 成 的 一 个 迭代 对 象 ， 
每 个 二 元 组 是 由 可 迭代 参数 的 索引 号 及 其 对 应 的 元 素 组 成 的 。 举 个 例子 你 就 明白 了 : 


>>> strl = "FishC" 
>>> for each in enumerate(strl): 
print(each) 


(0, 'F') 
(1. 1 
(2, 's') 
(3, T) 
(4, 'C') 


11. ziptiter1 | .iter2 | ...] D 


zpOJrik HET 3k [el t d 47 ur 3: 9 080 [8] 2H RHI TCH . 2151 U^ EG ETE ZI EE : 


>>> listl = [1, 3, 5, 7, 9] 

>>> strl = "FishC" 

>>> for each in zip(list1, str1): 
print(each) 


(1, 'F') 

(3, 'i') 

(5, 's') 

(7, 'h') 

(9, 'C') 

>>> tuplel = (2, 4, 6, 8, 10) 

>>> for each in zip(listl, strl, tuplel): 

print(each) 


(1, 'F', 2) 
53s 
(5, "s", 6) 
(7, 'h', 8) 
(9, 'C', 10) 
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6.1 Python 的 乐高 积 
S. 1 


小 时 候 大 家 应 该 都 玩 过 乐高 积木 ,只 要 通过 想象 和 创意 ,可 以 用 它 拼 次 出 很 多 神奇 的 东 
西 。 随 着 学 习 的 深入 ,编写 的 代码 日 益 增 加 并 且 越 来 越 复杂 ,所 以 需要 找 一 个 方法 对 这 些 复 杂 
的 代码 进行 重新 组 织 。 这 么 做 的 目的 是 使 得 代码 更 为 癸 单 易 懂 。 我 们 说 优秀 的 东西 永远 是 经 
典 的 ,而 经 典 的 东西 永 还 是 简单 的 。 不 是 说 复杂 不 好 ,要 能 够 把 复杂 的 东西 简单 化 才能 成 为 
经 典 。 

为 了 使 得 程序 的 代码 更 为 简单 ,就 需要 把 程序 分 解 成 较 小 的 组 成 部 分 。 这 里 会 教 大 家 三 
种 方法 来 实现 ,分 别 是 函数 、 对 象 和 模块 。 


6.1.1 创建 和 调用 函数 


困 数 就 是 把 代码 打包 成 不 同形 状 的 乐高 积木 ,以 便 可 以 发 挥 想象 力 进 行 随意 拼装 和 反复 
使 用 。 此 前 接触 的 BIF 就 是 Python 帮 我 们 封 滩 好 的 函数 ,用 的 时 候 很 方便 ,根本 不 宕 要 去 想 
实现 的 原理 ,这 就 是 把 复杂 变 简 单 。 

KHA 3x JL AE VI EXE f Python 编程 者 的 基本 功底 ,所 以 小 甲鱼 在 这 几 部 分 的 准备 上 
是 花 足 了 心思 的 ,大 家 不 要 嫌 哆 唆 一 一 经 常 变 看 花样 儿 重 复出 现 的 内 容 肯 定 是 最 重要 的 。 

简单 来 讲 , 一 个 程序 可 以 按照 不 同 功 能 的 实现 ,分 割 成 许 许多 多 的 代码 块 ,每 一 个 代码 块 
就 可 以 封装 成 一 个 函数 。 在 Python 中 创建 一 个 函数 用 def 关键 字 : 


电 


>>> def myFirstFunction( ): 
print(" 这 是 我 创建 的 第 一 个 函数 !") 
print(" 我 表示 很 激动 …") 
print(" 在 这 里 ,我 要 感谢 TBB, 感谢 CCAV! ") 
注意 ,在 图 数 名 后 边 要 加 上 一 对 小 括号 哦 。 这 对 小 括号 是 必 不 可 少 的 ,因为 有 时 候 需 要 在 
里 边 放 点 东西 ,至 于 放 什 么 ,小 甲鱼 先 卖 个 关子 , 待 会 儿 告 诉 你 。 
我 们 创建 了 一 个 函数 ,但 是 从 来 都 不 去 调用 它 ,那么 这 个 困 数 里 的 代码 就 永远 也 不 会 被 执 
行 。 这 里 教 大 家 如 何 调 用 一 个 阴 数 。 调 用 一 个 函数 也 非常 便 单 ,直接 写 出 函数 名 加 上 小 括号 
即 可 : 


>>> myFirstFunction() 


这 是 我 创建 的 第 一 个 函数 ! 


第 0 章 ”函数 ||> 


我 表示 很 激动 … 

在 这 里 ,我 要 感谢 TBB, 感谢 CCAV! 

函数 的 调用 和 运行 机 制 : 24 PRÉC myFirstFunction() 发 生 调用 操作 的 时 候 ,Python 会 自动 
往 上 找到 def myFirstFunction() 的 定义 过 程 ,然后 依次 执行 该 阴 数 所 包含 的 代码 块 部 分 (也 就 
是 冒号 后 边 的 缩 进 部 分 内 容 ) 。 只 需要 一 条 语句 ,就 可 以 轻松 地 实现 函数 内 的 所 有 功能 。 假 如 
我 想 把 刚才 的 内 容 打印 3 次 ,我 只 需要 调用 3 次 函数 即 可 .: 


>>> for i in range(3): 
myFirstFunction() 


这 是 我 创建 的 第 一 个 函数 ! 

我 表示 很 激动 … 

在 这 里 ,我 要 感谢 TBB, 感谢 CCAV! 
这 是 我 创建 的 第 一 个 函数 ! 

我 表示 很 激动 … 

在 这 里 ,我 要 感谢 TBB, 感谢 CCAV! 
这 是 我 创建 的 第 一 个 函数 ! 

我 表示 很 激动 … 

在 这 里 ,我 要 感谢 TBB, 感谢 CCAV! 


6.1.2 函数 的 参数 


现在 可 以 来 谈 谈 括号 里 是 什么 东西 了 ! 其 实 括号 里 放 的 就 是 函数 的 参数 。 在 函数 刚 开始 
锌 发明 出 来 的 时 候 , 是 没有 参数 的 (也 就 是 说 ,小 括号 里 没有 内 容 ) ,很 快 就 引 来 了 许多 小 伙伴 
们 的 质疑 : 图 数 不 过 是 对 做 同样 内 容 的 代码 进行 打包 ,这 样 跟 使 用 循环 就 没有 什么 本 质 不 
同 了 。 

所 以 ,为 了 使 每 次 调用 的 函数 可 以 有 不 同 的 实现 ,加 入 了 参数 的 概念 。 例 如 ,你 封装 了 一 
个 开炮 功能 的 函数 ,默认 武 带 是 大 炮 , 那 用 来 打 飞 机 是 没 问 题 的 ,但 是 你 如 果 用 这 个 函数 来 打 
小 鸟 ,除非 是 愤怒 的 小 鸟 ,否则 就 有 点 奇 龙 了 。 有 了 参数 的 实现 ,就 可 以 轻松 地 将 大 炮 换 成 步 
枪 。 上 总 而 言 之 ,参数 就 是 使 得 函数 可 以 实现 个 性 化 : 


>>> def mySecondFunction( name): 


print(name + "是 帅 锅 !") 


>>> mySecondFunction(" 小 甲鱼 ") 
小 甲鱼 是 帅 锅 ! 
>>> mySecondFunction(" 小 鲜 包 ") 
小 鲜 鱼 是 帅 锅 ! 
>>> mySecondFunction(" 小 丑 鱼 ") 
小 丑 鱼 是 帅 锅 ! 


刚才 的 例子 只 有 一 个 参数 ,使 用 多 个 参数 ,只 需要 用 逗号 隅 开 即 可 : 


>>> def add(numl, num2): 
print(numl + num2) 


>>> add(1, 2) 
3 
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那 有 些 读者 要 问 了 ,到 底 Python 的 函数 支持 多 少 参 数 呢 ? 实 际 上 你 想 要 有 多 少 个 参数 
就 可 以 有 多 少 个 参数 ,就 像 Windows 的 某 些 API 函数 就 有 十 几 个 参数 。 但 是 建议 大 家 自己 
定义 的 函数 参数 尽量 不 要 太 多 ,函数 的 功能 和 参数 的 意义 也 要 相应 写 好 注释 ,这 样 别 人 来 维护 
你 的 程序 才 不 会 那么 费劲 ! 


6.1.3 函数 的 返回 值 


有 些 时 候 , 需 要 胃 数 为 我 们 返回 一 些 数据 来 报告 执行 的 结果 ,譬如 刚才 提 到 具有 开炮 功能 
的 胃 数 ,炮弹 发 射 了 之 后 到 底 是 打 中 了 没有 ? 你 总 得 有 个 交代 吧 。 所 以 ,我 们 的 郴 数 需要 返回 
值 。 其 实 也 非 痕 简单 ,只 需要 在 男 数 中 使 用 关键 字 return ,后 边 跟 独 的 就 是 指定 要 返回 的 值 : 
>>> def add(numl, num2): 


return numl + num2 


>>> add(1, 2) 
3 


6.2 灵活 即 强大 


有 时 候 , 评 论 一 种 编程 语言 是 否 优秀 ,往往 是 看 它 是 否 灵 活 。 灵 活 并 非 童 味 关 无 所 不 能 、 
无 所 不 包 , 那 样 就 会 显得 庞大 和 元 淋 。 灵 活 应 该 表现 为 多 变 , 比 如 前 面 学 到 的 参数 ,函数 因 参 
数 而 灵活 。 如 有 果 没 有 参数 ,一 个 函数 就 只 能 死板 地 完成 一 个 功能 ,一 项 任务 。 


6.2.1 形 参 和 实 参 


参数 从 调用 的 角度 来 说 ,分 为 形式 参数 (parameter) 和 实际 参数 (argument)( 注 : 本 书后 
边 简 称 为 形 参 和 实 参 ) 。 跟 绝 大 多 数 编程 语言 一 样 , 形 参 指 的 是 函数 创建 和 和 定义 过 程 中 小 括号 
里 的 参数 ,而 实 参 则 指 的 是 图 数 在 被 调用 的 过 程 中 传递 进来 的 参数 。 举 个 例子 : 


>>> def myFirstFunction(name): 
print(name) 


>>> myFirstFunction("/]Hi fü") 

小 甲鱼 

myFristFunction(name) 的 name 是 形 参 ,因为 它 只 是 代表 一 个 位 置 一 个 变量 名 ; 而 调用 
myFirstFunction(" 小 甲鱼 ") 传 递 的 "小 甲鱼 "是 实 参 ,因为 它 是 一 个 具体 的 内 容 , 是 赋值 到 变 
量 名 中 的 值 ! 


6.2.2 HZ X 


给 函数 写 文 档 是 为 了 让 别人 可 以 更 好 地 理解 你 的 函数 ,所 以 这 是 一 个 好 习惯 。 有 些 读者 
可 能 不 理解 为 什么 日 己 写 的 函数 要 跟 别 人 分 至 呢 ?” 因 为 在 实际 开发 中 ,个 人 的 工作 量 和 能 力 
确实 相当 有 限 ,因此 中 大 型 的 程序 永远 都 是 团队 来 完成 的 。 大 家 的 代码 要 相互 衔接 ,就 需要 先 
阅读 别人 提供 的 文档 ,因此 适当 的 文档 说 明 非 常 重要 。 而 函数 文档 的 作用 是 描述 该 函数 的 功 
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能 ,当然 ,这 是 写 给 人 看 的 : 


>>> def exchangeRate( dollar): 
""" 美 元 i Jte 人 人民币 
汇率 暂 定 为 6.5 


return dollar * 6.5 


>>> exchangeRate( 10) 
65.0 


我 们 看 到 ,在 函数 开头 写 下 的 字符 串 是 不 会 打印 出 来 的 ,但 它 会 作为 函数 的 一 部 分 存储 起 
来 。 这 个 称 为 函数 文档 字符 串 , 它 的 功能 跟 注释 是 一 样 的 。 

那 有 读者 可 能 会 说 ,既然 一 样 , 搞 那 么 复杂 干 噜 呀 ? 其 实 也 不 是 完全 一 样 ,函数 的 文档 字 
符 串 可 以 通过 特殊 属性 _doc_ 获取 ( 注 : _doc_ 两 边 分 别 是 两 条 下 划 线 ) : 

>>> exchangeRate. doc 

' 美 元 -> 人 民 币 \n\t 汇率 暂 定 为 6.5\n\t' 

另外 , 想 用 一 个 函数 却 不 确定 其 用 法 的 时 候 , 会 通过 help() 函 数 来 查看 函数 的 文档 。 因 
此 ,对 我 们 上 自己 的 函数 也 可 以 依法 炮制 : 


>>> help(exchangeRate) 
Help on function exchangeRate in module | main : 


exchangeRate( dollar) 
美元 -> 人 民 币 
汇率 暂 定 为 6.5 


6.2.3 关键 字 参 数 


普通 的 参数 叫 位 置 参 数 , 通 常 在 调用 一 个 函数 的 时 候 , 粗 心 的 程序 员 很 容易 会 摘 乱 位 置 参 
数 的 顺序 ,以 至 于 函数 无 法 按照 预期 实现 。 因 此 ,有 了 关键 字 参 数 。 使 用 关键 字 参 数 ,就 可 以 
很 简单 地 解决 这 个 潜在 的 问题 ,来 看 个 例子 ， 


>>> def saySomething(name, words): 
print(name + “一 >' + words) 


>>> saySomething("/]V P fa", "让 编程 改变 世界 !”) 

小 甲鱼 -> 让 编程 改变 世界 ! 

>>> saySomething(" 让 编程 改变 世界 !"，" 小 甲鱼 ") 

让 编程 改变 世界 ! - > 小 甲鱼 

>>> saySomething(words = "让 编程 改变 世界 !", name = "/FB fa") 

小 甲鱼 -> 让 编程 改变 世界 ! 

关键 字 参 数 其 实 就 是 在 传人 实 参 时 指定 形 参 的 变量 名 ,尽管 使 用 这 种 技巧 要 多 打 一 些 字 ， 
但 随 着 程序 规模 越 来 越 大 、 参 数 越 来 越 多 ,关键 字 参 数 起 到 的 作用 就 越 明 显 。 毕 竟 宁 可 多 打 几 
个 字符 ,也 不 希望 出 现 料想 不 及 的 BUG, 


6.2.4 默认 参数 
初学 者 很 容易 搞 混 关键 字 参 数 和 默认 参数 ,默认 参数 是 在 定义 的 时 候 赋予 了 默认 值 的 
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参数 ， 


>>> def saySomething(name = "小 甲鱼 "，words = "让 编程 改变 世界 !"): 


print(name + '->' + words) 


>>> saySomething() 

小 甲鱼 -> 让 编程 改变 世界 ! 

>>> saySomething(" 苏 轼 "，" 不 识 庐山 真面目 ,只 缘 身 在 此 山中 。") 

苏轼 -> 不 识 庐山 真面目 ,只 缘 身 在 此 山中 。 

>>> saySomething(words = " 古 之 成 大 事 者 ,不 惟有 超 世 之 才 , 亦 有 坚忍 不 拔 之 志 。"，name = "苏轼 ") 
苏轼 -> 古 之 成 大 事 者 ,不 惟有 超 世 之 才 , 亦 有 坚忍 不 拔 之 志 。 


使 用 默认 参数 的 话 , 就 可 以 不 市 参数 去 调用 限 数 。 所 以 ,它们 之 间 的 区 别 是 : 关键 字 参 数 
是 在 函数 调用 的 时 候 , 通 过 参数 名 指定 要 赋值 的 参数 ,这 样 做 就 不 怕 因 为 搞 不 清 参 数 的 顺序 而 
导致 图 数 调用 出 错 ; 而 默认 参数 是 在 参数 定义 的 过 程 中 ,为 形 参 赋 初 值 , 当 困 数 调用 的 时 候 ， 
不 传递 实 参 , 则 默认 使 用 形 参 的 初始 值 代替 。 


6.2.5 收集 参数 


这 个 名 字 听 起 来 比较 新 鲜 ,其实 大 多 数 时 候 它 也 被 称 作 可 变 参 数 。 发 明 这 种 机 制 的 动机 
是 因数 的 作者 有 时 候 也 不 知道 这 个 图 数 到 旗 需 要 多 少 个 参数 …… 听 起 来 有 点 令 人 不 解 ,但 确 
实 有 这 类 情况 。 这 时 候 , 仅 需要 在 参数 前 边 加 上 星 号 (x ) 即 可 : 


>>> def test( * params): 
prin(" &d^- S" % len(params)) 
print(" 第 二 个 参数 是 : ", params[1]) 

>>> test('F', 'i', 's', 'h', 'C') 

有 5 个 参数 

第 二 个 参数 是 : i 

>>> test(" 小 甲鱼 "，123，3.14) 

有 3 个 参数 

第 二 个 参数 是 : 123 


其 实 大 家 仔细 思考 后 也 不 难 理解 ,Python 就 是 把 标志 为 收集 参数 的 参数 们 打包 成 一 个 元 
组 。 不 过 这 里 需要 注意 一 下 ,如果 在 收集 参数 后 边 还 需要 指定 其 他 参数 ,在 调用 函数 的 时 候 就 应 
该 使 用 关键 参数 来 指定 ,否则 Python 就 都 会 把 你 的 实 参 都 列 人 收集 参数 的 范畴 。 举 个 例子 : 


>>> def test( * params, extra): 
print(" 收 集 参数 是 : ", params) 
print(" 位 置 参 数 是 : ", extra) 

>>> test(1, 2, 3, 4, 5, 6, 7, 8) 

Traceback (most recent call last): 

File "<pyshell# 40>", line 1, in <module> 

test(1, 2, 3, 4, 5, 6, 7, 8) 

TypeError: test() missing 1 required keyword - only argument: 'extra' 

>>> test(1, 2, 3, 4, 5, 6, 7, extra - 8) 

收集 参数 是 : (1, 2, 3, 4, 5, 6, 7) 

位 置 参数 是 : 8 


建议 大 家 如 果 你 的 参数 中 带 有 收集 参数 ,那么 可 将 其 他 参数 设置 为 默认 参数 ,这 样 不 容易 
出 错 : 
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>>> def test( * params, extra - "8"): 
print(" 收 集 参 数 是 : ", params) 
print(" 位 置 参 数 是 : ", extra) 

»»» best(1, 2, 3, 4, 5, 6, 7, B) 

收集 参数 是 : (1, 2, 3, 4, 5, 6, 7, 8) 

位 置 参数 是 : 8 


星 号 (x* ) 其 实 既 可 以 打包 又 可 以 “ 解 包 ”。“ 解 包 ” 又 是 怎么 回 事 呢 ? 举 个 例子 ,假如 你 需 
要 将 一 个 列表 a f£ X test 参数 的 收集 参数 * param 中 ,那么 调用 test(a) 时 便 会 出 错 , 此 时 需 
要 在 a 前 边 加 上 个 星 号 (x ) 表 示 实 参 需 要 “ 解 包 ” 后 才能 使 用 : 


>>> def test( * params): 
print(" 有 名 d 个 参数 " % len(params)) 
print(" 第 二 个 参数 是 : ", parans[1]) 
>>>a = [1,2,3,4, 5, 6, 7, 8] 
>>> test(a) & 直接 将 列表 名 a 作 为 实 参 将 会 出 错 
有 1 个 参数 
Traceback (most recent call last): 
File "< pyshell£ 48>", line 1, in < module» 
test(a) & 直接 将 列表 名 a 作为 实 参 将 会 出 错 
File "< pyshell£ 46>", line 3, in test 
print(" 第 二 个 参数 是 : ", parans[1]) 
IndexError: tuple index out of range 
>>> test( * a) & 实 参 前 边 加 上 星 号 ( * ) 表 示 解 包 
有 8 个 参数 
第 二 个 参数 是 : 2 


Python 还 有 男 一 种 收集 方式 ,就 是 用 两 个 星 号 ( xx ) 表 示 。 跟 前 面 的 介绍 不 同 , 两 个 星 号 
的 收集 参数 表示 为 将 参数 们 打包 成 字典 的 形式 。 字 典 的 概念 还 没有 接触 ,所 以 在 后 边 讲 解 字 
典 的 章节 中 再 给 大 家 介绍 吧 。 


6.3 我 的 地 盘 听 我 的 


6.3.1 函数 和 过 程 


在 很 多 编程 语言 中 ,图 数 和 过 程 其 实 是 区 分 开 的 。 一 般 认 为 图 数 (function) 是 有 返回 值 
的 ,而 过 程 (procedure) 是 简单 、 特 殊 并 且 没 有 返回 值 的 。 也 就 是 说 ,因数 是 干 完事 儿 必 须 写 报 
告 的 “和 兰 通 ”, 而 过 程 是 完事 后 拍 拍 屁股 一 走 了 之 的 “小 混 重 ”。 

Python 严格 来 说 只 有 函数 ,没有 过 程 ! 此 话 怎 讲 ? 有 些 朋 友 可 能 会 说 ,在 没有 介绍 
return 之 前 ,Python 的 函数 不 也 没有 返回 值 吗 ? 此 言 差 疾 ,为 了 让 大 家 更 好 地 理解 “Python 
严格 来 说 只 有 函数 ,没有 过 程 1” 这 句 话 ,大 家 一 起 看 看 下 面 的 例子 : 

>>> def hello(): 

print("Hello-—") 
>>> print(hello()) 


Hello-- 
None 
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调用 print(hello()) 之 后 打印 了 两 行文 字 , 第 一 行 我 们 当然 知道 是 hello() 函 数 执行 的 ,第 
ZTH None 是 怎么 回 事 ? 没 错 , 大 家 猿 对 了 。 当 不 写 return 语句 的 时 候 , 默 认 Python 会 认 
为 图 数 是 return None 的 。 所 以 说 Python 所 有 的 函数 都 有 返回 值 。 

6.3.2 再 谈 谈 返回 值 

在 许多 编程 语言 中 ,我 们 说 一 个 函数 是 整 型 ,其 实 我 们 的 意思 是 指 这 个 阴 数 会 返回 一 个 整 
型 的 返回 值 。 而 Python 不 这 么 干 ,Python 可 以 动态 确定 困 数 的 类 型 ,而 且 果 数 还 能 返回 不 同 
类 型 的 值 。 还 记得 以 前 说 过 "Python 没有 变量 ,只 有 名 字 ” 这 人 句 话 吗 ? 只 需 知 道 Python ZR 
回 一 个 东西 ,然后 拿 来 用 就 可 以 了 。 另 外 ,Python 似乎 还 可 以 同时 返回 多 个 值 : 

>>> def test(): 

return [1, "/hH f&', 3.14] 

>>> test() 

[1, VAP f&', 3.14] 

Python 可 以 利用 列表 打包 多 种 类 型 的 值 一 次 性 返回 。 当 然 , 你 也 可 以 直接 用 元 组 的 形式 
返回 多 个 值 : 

>>> def test(): 

return 1, '/]H f&', 3.14 


>>> test() 


(1, VP f&', 3.14) 


6.3.3 函数 变量 的 作用 域 


其 实 这 里 要 谈 的 是 函数 变量 的 作用 域 ,也 许 你 早已 经 昕 说 了 局 部 变量 和 全 局 变量 ,也 许 你 
早已 经 熟练 于 其 他 编程 语言 的 变量 作用 域 的 细节 ,但 无 论 如 何 这 里 你 要 认真 学 ,因为 这 是 重 
点 ,也 许 真 有 你 平时 注意 不 到 的 细节 呢 。 

变量 的 作用 域 也 就 是 平时 所 说 的 变量 可 见 性 ,如 上 所 说 ,一 般 的 编程 语言 都 有 局 部 变量 
(Local Variable) 和 全 局 变量 (Global Variable) 之 分 。 分 析 以 下 代码 ; 


# p6 l.py 
def discounts(price, rate): 
final price - price * rate 


return final price 


old price = float(input( ' 请 输入 原价 : ')) 
rate = float(input( ' 请 输入 折扣 率 : ')) 
new price = discounts(old price, rate) 


print( ' 打 折 后 价格 是 : ', new price) 
程序 执行 结果 如 下 : 


>>> 

请 输入 原价 : 80 

请 输入 折扣 率 : 0.75 
打折 后 价格 是 : 60.0 


222 


。 DO 5 


gOz mJ» 


来 分 析 一 下 代码 : H K% discounts() 中 ,两 个 参数 是 price 和 rate, 还 有 一 个 是 final_ 
price ,它们 都 是 discounts O 图 数 中 的 局 部 变量 。 为 什么 把 它们 称 为 局 部 变量 呢 ? 不 妨 修 改 一 
PAS. 


# p6 2.py 

def discounts(price, rate): 
final price - price * rate 
return final price 


old price = float(input( ' 请 输入 原价 : ')) 

rate = float(input( ' 请 输入 折扣 率 : ')) 

new price = discounts(old price, rate) 

print( ' 打 折 后 价格 是 : ', new price) 

print( ' 这 里 试图 打印 局 部 变量 final price 的 值 : '，final price) 


程序 走 起 , 像 刚 才 一 样 输入 之 后 程序 便 报 错 了 : 


>>> 
请 输入 原价 : 80 
请 输入 折扣 率 : 0.75 
打折 后 价格 是 : 60.0 
Traceback (most recent call last): 
File "E:\p6 2.py", line 10, in <module> 
print( ' 这 里 试图 打印 局 部 变量 final price 的 值 : ', final price) 


NameError: name 'final price' is not defined 
>>> 


错误 原因 : final price 没有 被 定义 过 ,也 就 是 说 ,Python 找 不 到 final price 这 个 变量 。 这 
是 因为 final price 只 是 一 个 局 部 变量 , 它 的 作用 范围 只 在 它 的 地 盘 上 discounts O PR Zi [1j 
定义 范围 内 一 有 效 , 出 了 这 个 范围 ,就 不 冉 属于 它 的 地 盘 了 , 它 将 什么 都 不 是 。 

总 结 一 下 : 在 函数 里 边 定义 的 参数 以 及 变量 ,都 称 为 局 部 变量 ,出 了 这 个 函数 ,这 些 变 量 
都 是 无 效 的 。 事 实 上 的 原理 是 ,Python 在 运行 男 数 的 时 候 , 利 用 栈 (CStack) 进 行 存 储 , 当 执行 
完 该 图 数 后 , 困 数 中 的 所 有 数据 都 会 被 目 动 删除 。 所 以 在 困 数 外 边 是 无 法 访问 到 男 数 内 部 的 
局 部 变量 的 。 

与 局 部 变量 相对 的 是 全 局 变量 ,程序 中 old. price; new. price, rate 都 是 在 图 数 外 边 定 义 
的 ,它们 都 是 全 局 变量 ,全 局 变量 拥有 更 大 的 作用 域 , 例 如 在 盟 数 中 可 以 访问 到 它们 : 

# p6 3.py 


def discounts(price, rate): 


final price = price * rate 
print( ' 这 里 试图 打印 全 局 变量 old price 的 值 : ', old price) 


return final price 


old price = float(input( ' 请 输入 原价 : ')) 
rate = float(input( ' 请 输入 折扣 率 : ')) 
new price = discounts(old price, rate) 


print(' 打 折 后 价格 是 : ', new price) 
程序 执行 结果 如 下 - 
>>> 


e 57 œ 


«|| 零 基 础 入 门 学 习 Python 


请 输入 原价 : 80 

请 输入 折扣 率 : 0.75 

这 里 试图 打印 全 局 变量 old price 的 值 : 80.0 
打折 后 价格 是 : 60.0 


>>> 


真 的 可 以 实现 ,看 上 去 似乎 全 局 变量 更 为 霸道 ! 不 过 使 用 全 局 变量 的 时 候 要 千 万 小 心 ,在 
任何 一 种 编程 语言 中 都 是 如 此 。 在 Python 中 ,你 可 以 在 函数 中 肆 无 忌 异 地 访问 一 个 全 局 变 
量 ,但 如 果 你 试图 去 修改 它 , 就 会 有 奇怪 的 事情 会 发 生 了 。 分 析 下 面 的 代码 ; 


# p6 4.py 
def discounts(price, rate): 
final price - price * rate 
old price = 50 # 这 里 试图 修改 全 局 变量 
print( ' 在 局 部 变量 中 修改 后 old price 的 值 是 : ', old price) 


return final price 


old price = float(input( ifi A Jm: ')) 

rate = float(input( ' 请 输入 折扣 率 : ')) 

new price = discounts(old price, rate) 

print( ' 全 局 变量 old price 现在 的 值 是 : ', old price) 
print(' 打 折 后 价格 是 : ', new price) 


程序 执行 结果 如 下 : 


>>> 

请 输入 原价 : 80 

请 输入 折扣 率 : 0.75 

在 局 部 变量 中 修改 后 old_price 的 值 是 : 50 
全 局 变量 old price 现在 的 值 是 : 80.0 
打折 后 价格 是 : 60.0 


>>> 


ix HU ESL Im X ZEIT BIEBL T W RE BR ACA SAM po JEE BA Python 会 创建 一 
个 新 的 局 部 变量 替代 (名 字 跟 全 局 变量 相同 ) ,但 真正 的 全 局 变量 是 纹 丝 不 动 的 ,所 以 实现 的 结 
果 和 大 家 的 预期 不 同 。 

关于 全 局 变量 ,我 们 也 来 总 结 一 下 : 全 局 变量 在 整个 代码 段 中 都 是 可 以 访问 到 的 ,但 是 不 
要 试图 在 函数 内 部 去 修改 全 局 变量 的 值 , 因 为 那样 Python 会 自动 在 函数 内 部 新 建 一 个 名 字 
一 样 的 局 部 变量 代 蔡 。 

对 于 初学 者 来 说 ,局 部 变量 和 全 局 变量 在 使 用 上 很 容易 犯错 ,尤其 是 很 多 朋友 都 试图 去 建 
立 一 个 跟 全 局 变量 同名 的 局 部 变量 ,这 类 做 法 小 甲鱼 是 强烈 反对 的 。 那 我 如 果 想 在 函数 里 边 
去 修改 全 局 变量 的 值 , 有 办 法 实现 吗 ? 如 果 我 在 函数 里 边 想 骨 套 定义 一 个 新 的 函数 ,可 以 吗 ? 
这 些 问题 的 答案 都 是 肯定 的 ,不 过 我 们 将 在 下 一 节 再 跟 大 家 详细 讲解 。 


6.4 EAE Ef 


6.4.1 global 关键 字 
全 局 变量 的 作用 域 是 整个 模块 (整个 代码 段 ), 也 就 是 代码 段 内 所 有 的 函数 内 部 都 可 以 访 


. DR 。 


g6% mus» 


[8] | 4 Jj E ft, [HE E TE ER] — ae A: E RRA DC DC E UJ I8] eg AE fi Lf IS EXE E 
改 它 。 

因 为 那样 的 话 ,Python 会 使 用 屏蔽 (Shadowing) 的 方式 “保护 ”全 局 变量 : 一 旦 困 数 内 部 
试图 修改 全 局 变量 ,Python 就 会 在 子 数 内 部 自动 创建 一 个 名 字 一 模 一 样 的 局 部 变量 ,这 样 修 
改 的 结果 只 会 修改 到 局 部 变量 ,而 不 会 影响 到 全 局 变量 。 看 下 面 的 例子 : 

>>> count = 5 

>>> def myFun(): 


count - 10 
print(count) 


>>> myFun() 
10 

>>> count 

5 


但 是 毕竟 人 是 要 灵活 应 变 的 ,假设 你 已 经 完全 了 解 在 函数 中 修改 全 局 变量 可 能 会 导致 程 
订 可 读 性 变 差 出 现 葛 名 其 妙 的 BUG 代码 的 维护 成 本 提高 ,但 你 还 是 坚持 “虚心 接受 , 死 性 不 
改 ” 这 八字 原则 ,仍然 觉得 有 必要 在 函数 中 去 修改 这 个 全 局 变量 ,那么 你 不 妨 可 以 使 用 global 
关键 字 来 达到 目的 ! 修改 程序 如 下 : 


>>> count = 5 

>>> def myFun(): 
global count 
count - 10 
print(count) 


>>> myFun() 
10 

>>> count 
10 


6.4.2 AE AX 


Python ff] FR OGE X 4 uf LUCES H, 9E Ji: fo VE E PR RAN E81] E 55 — A PR 2C. h pR cm] 
VE VE PR IS VIPERA. RERE NAF : 


>>> def funl(): 
print("funl()1E TE 8E 3] JH -- ") 
def fun2(): 
print("fun2() 正 在 被 调用 … ") 
fun2() 


>>> funl() 
funl()1E TE 8& yi FH -- 
fun2() 正 在 被 调用 -- 


这 是 函数 上 藤 套 的 最 简单 的 例子 ,虽然 看 起 来 没什么 用 …… 不 过 它 麻 淮 虽 小 ,五 胜 俱 全 。 关 
于 内 部 函数 的 使 用 ,有 一 个 比较 值得 注意 的 地 方 ,就 是 内 部 函数 整个 作用 域 都 在 外 部 函数 之 
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内 。 就 像 刚才 例子 中 的 fun2() 整 个 图 数 的 作用 域 都 在 funl() 里 边 。 
需要 注意 的 地 方 是 ,除了 在 funl() 这 个 困 数 体 中 可 以 随意 调用 fun2() 这 个 内 部 函数 外 ， 
出 了 funl() ,就 没有 任何 可 以 对 fun2() 进 行 的 调用 。 如 果 在 funl() 外 部 试图 调用 内 部 晒 数 
fun2() ,就 会 报错 : 
>>> fun2() 
Traceback (most recent call last): 
File "<pyshell# 30>", line 1, in <module> 


fun2() 
NameError: name 'fun2' is not defined 


6.4.3 闭 包 (closure) 


闭 包 (closure) 是 因数 式 编 程 的 一 个 重要 的 语法 结构 ,图 数 式 编 程 是 一 种 编程 范式 ,著名 
的 函数 式 编 程 语 言 就 是 LISP 语言 (大 家 可 能 听 说 过 这 门 语言 ,主要 应 用 于 绘图 和 人 工 乔 能， 
一 直 被 认为 是 天 才 程 序 员 使 用 的 语言 )。 

那么 不 同 的 编程 语言 实现 闭 包 的 方式 不 同 ,Python 中 的 闭 包 从 表现 形式 上 定义 为 : 如 果 
在 一 个 内 部 函数 里 ,对 在 外 部 作用 域 ( 但 不 是 在 全 局 作用 域 ) 的 变量 进行 引用 ,那么 内 部 函数 就 
被 认为 是 闭 包 (closure)。 还 是 来 举 个 例子 说 明 比 较 好 理解 : 

>>> def funX(x): 

def funY(y): 


return X * y 
return funY 


>>> i = funX(8) 
>>> i(5) 
40 


也 可 以 直接 这 么 写 ， 


>>> funX(8)(5) 
40 


通过 上 面 的 例子 理解 闭 包 的 概念 : 如 条 在 一 个 内 部 困 数 里 (funY 就 是 这 个 内 部 函数 ) 对 
外 部 作用 域 ( 但 不 是 在 全 局 作用 域 ) 的 变量 进行 引用 (x 就 是 被 引用 的 变量 ,x 在 外 部 作用 域 
funX 员 数 里 面 ,但 不 在 全 局 作用 域 里 ) , 则 这 个 内 部 限 数 (funY) 就 是 一 个 闭 包 ，。 

使 用 闭 包 需要 注意 的 是 : 因为 团 包 的 概念 就 是 由 内 部 函数 而 来 的 ,所 以 你 也 不 能 在 外 部 
轴 数 以 外 的 地 方 对 内 部 图 数 进 行 调 用 ,下 面 的 做 法 是 错误 的 : 

>>> funY(5) 

Traceback (most recent call last): 

File "< pyshell£ 39>", line 1, in < module» 
funY(5) 
NameError: name 'funY'is not defined 


在 闭 包 中 ,外 部 函数 的 局 部 变量 对 应 内 部 函数 的 局 部 变量 ,事实 上 相当 于 之 前 讲 的 全 局 变 
量 跟 局 部 变量 的 对 应 关系 ,在 内 部 函数 中 ,你 只 能 对 外 部 函数 的 局 部 变量 进行 访问 ,但 不 能 进 
行 修改 。 


. 60 。 


>>> def funX(): 


X= 5 

def funY(): 
x *7 X 
return x 


return funY 


>>> funX()() 
Traceback (most recent call last): 
File "< pyshell£ 47>", line 1, in < module» 
funX( )() 
File "< pyshell£ 46>", line 4, in funY 
X *7 X 


UnboundLocalError: local variable 'x'referenced before assignment 


这 个 报错 信息 跟 之 前 讲解 全 局 变量 的 时 候 基 本 一 样 ,Python 认为 在 内 部 函数 的 x 是 局 部 


变量 的 时 候 , 外 部 函数 的 x 就 被 屏蔽 了 起 来 ,所 以 执行 x x* 三 x 的 时 候 , 在 右边 根本 就 找 不 到 
局 部 变量 x 的 值 ,因此 报错 。 


在 Python3 以 前 并 没有 直接 的 解决 方案 ,只 能 间接 地 通过 容器 类 型 来 存放 ,因为 容器 类 


>>> def funX(): 
x = [5] 
def funY(): 
x[0] *-» x[0] 
return x[0] 
return funY 


>>> funX()() 
29 


型 不 是 放 在 栈 里 ,所 以 不 会 被 “屏蔽 ?” 掉 。 容 器 类 型 这 个 词 儿 大 家 是 不 是 似曾相识 ? 之 前 介 
绍 的 字符 串 、 列 表 、 元 组 ,这 些 啥 都 可 以 往 里 的 放 的 就 是 容器 类 型 。 于 是 可 以 把 代码 改造 
如 下 : 


到 了 Python3 的 世界 里 ,有 了 不 少 的 改进 。 如 果 硕 望 在 内 部 函数 里 可 以 修改 外 部 函数 里 


的 局 部 变量 的 值 ,那么 也 有 一 个 关键 字 可 以 使 用 ,就 是 nonlocal, 使 用 方式 跟 global 一 样 . 


>>> def funX(): 


X = 5 

def funY(): 
nonlocal x 
x *7 X 
return x 


return funY 


>>> funX()() 
25 


扩展 阅读 -二 游戏 中 的 移动 角色 : 闭 包 (closure) 在 实际 开发 中 的 作用 (地 址 是 http: // 


bbs. fishc. com/thread-42656-1-1. html) 。 
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6.5 lambda Xx i^ 5& 
<D 


Python 允许 使 用 lambda 关键 字 来 创建 匿名 函数 。 我 们 提 到 一 个 新 的 关键 字 一 匿名 奖 


数 。 那 什么 是 匿名 函数 呢 ?” 匿 名 函数 跟 普通 函数 在 使 用 上 又 有 什么 不 同 呢 ?使 用 匿名 函数 又 
有 怎样 的 优势 呢 ? 
那 先 来 谈 谈 lambda 表达 式 怎 么 用 ,然后 再 来 讨论 它 的 意义 吧 。 先 来 定义 一 个 普通 的 函数 : 


>>> def ds(x): 
return 2 * x + 1 


>>> ds(5) 
11 


如 果 使 用 lambda 语句 来 定义 这 个 函数 ,就 会 变 成 这 样 : 


>>> lambda x :2 * x * 1 
<function < lambda > at 0x00000000007FCD08 > 


Python 的 lambda 表达 式 语法 非常 精简 (符合 Python 的 风格 ), 基 本 语法 是 在 冒号 (:) 左 
边 放 原 函 数 的 参数 ,可 以 有 多 个 参数 ,用 逗号 (,) 隔 开 即 可 ; 冒号 右边 是 返回 值 。 在 上 面 的 例 
子 中 我 们 发 现 lambda 语句 实际 上 是 返回 一 个 图 数 对 象 , 如 果 要 对 它 进 行使 用 ,只 需要 进行 简 
单 的 赋值 操作 即 可 : 

>>> g = lambdax :2 * x + 1 


>>> g(5) 
i1 


下 面 演示 lambda 表达 式 带 两 个 参数 的 例子 : 


>> # xe: 
>>> def add(x, y): 
return x 十 y 


>>> add(3, 4) 

3 

>> # 把 它 转换 为 lambda 表达 式 ; 

>>>g = lambdax, y: x * y 

>>> g(3, 4) 

7 

lambda 表达 式 的 作用 : 

(D) Python 写 一 些 执行 脚本 时 ,使 用 lambda 就 可 以 省 下 定义 函数 过 程 ,比如 说 只 是 需要 
写 个 简单 的 脚本 来 管理 服务 副 时 ,就 不 需要 专门 定义 一 个 函数 然后 再 写 调 用 ,使 用 lambda 就 
可 以 使 得 代码 更 加 精简 。 

(2) 对 于 一 些 比较 抽象 并 且 整 个 程序 执行 下 来 只 需要 调用 一 两 次 的 困 数 ,有 时 候 给 函数 
起 个 名 字 也 是 比较 头疼 的 问题 ,使 用 lambda 就 不 需要 考虑 命名 的 问题 了 。 

(3) 便 化 代码 的 可 读 性 ,由 于 阅读 普通 函数 经 常 要 跳 到 开头 def 定义 的 位 置 ,使 用 lambda 
函数 可 以 省 去 这 样 的 步骤 。 
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介绍 两 个 BIF: filter() 和 mapO 


接 下 来 给 大 家 介绍 Python 在 实际 应 用 中 比较 实用 的 两 个 BIF, 这 两 个 BIF 使 用 比 起 之 前 一 
步 到 位 的 内 建 函 数 来 说 ,相对 要 复杂 一 点 ,也 尝试 着 把 今天 学 到 的 lambda 表达 式 结合 在 一 起 。 


1. filter() 


d HE2ERUSS —- VI SEPRMIUE— ilu. RERA DESI SE B CS «zb UE as IT) JE 
用 就 显得 非常 重要 了 ,通过 过 滤 需 ,就 可 以 保留 你 所 关注 的 信息 ,把 其 他 不 感 兴趣 的 东西 直接 
丢掉 。 这 么 讲 大 家 应 该 就 了 解 了 , 那 Python 的 这 个 filter() 如何 来 实现 过 滤 的 功能 呢 ?” 先 来 
看 下 Python 自己 的 注释 : 


>>> help(filter) 
Help on class filter in module builtins: 


class filter(object) 


| filter(function or None, iterable) -- > filter object 
| 


| Return an iterator yielding those items of iterable for which function( item) 
| is true. If function is None, return the items that are true. 


大 概 意思 是 : fitr 有 两 个 参数 。 第 一 个 参数 可 以 是 一 个 图 数 也 可 以 是 None, 如 果 是 一 
个 图 数 的 话 , 则 将 第 二 个 可 和 迭 代数 据 里 的 每 一 个 元 素 作 为 图 数 的 参数 进行 计算 ,把 返回 
True Ir (E 9m 3e i 3e; 如 果 第 一 个 参数 为 None, 则 直接 将 第 二 个 参数 中 为 True W fü 90 x 
出 来 。 

这 么 说 有 些 朋 友 可 能 还 不 大 理解 ,小 甲鱼 还 是 用 傈 单 的 例子 帮助 解释 一 下 吧 : 

>>> temp = filter(None, [1, 0, False, True]) 

>>> list(temp) 

[1, True] 

利用 filterO . zt XU — A Siti xe ep ACHT] EUIS di : 


>>> def odd(x): 
return x * 2 


>>> temp = filter(odd, range(10)) 
>>> list(temp) 
pP 3; 2; dy 9] 


那 现 在 学 习 lambda 表达 式 后 ,完全 可 以 把 上 述 过 程 转 化 成 一 行 : 


>>> list(filter(lambda x : x % 2, range(10))) 
I1. 3, Je Ts 9] 


2. map() 


map 在 这 里 不 是 地 图 的 意思 ,在 编程 领域 ,map 一 般 作 “映射 ?来 解释 。map() 这 个 内 置 函 
数 也 有 两 个 参数 ,仍然 是 一 个 困 数 和 一 个 可 迭代 序列 ,将 序列 的 每 一 个 元 素 作 为 图 数 的 参数 进 
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行 运 算 加 工 ,直到 可 迭代 序列 每 个 元 素 都 加 工 完 毕 , 返 回 所 有 加 工 后 的 元 素 构 成 的 新 序列 。 
有 了 刚才 filter() 的 经 验 , 这 里 举 个 例子 让 大 家 知道 map() 的 用 法 : 


>>> list(map(lambda x : x * 2, range(10))) 
[0, 2, 4, 6, 8, 10, 12, 14, 16, 18] 


6.6 递归 


6.6.1 递归 是 “ 神 马 ” 


本 节 的 主题 叫 递归 是 “ 神 马 ”, 小 甲鱼 将 通过 带 感 的 讲解 ,来 告诉 大 家 “ 神 马 ”是 递归 。 如 果 
说 优秀 的 程序 员 是 伯乐 ,那么 把 递归 比喻 成 神 马 是 再 形象 不 过 的 了 ! 

递归 到 底 是 什么 东西 呢 ? 有 那么 厉害 吗 ? 为 什么 大 家 常 说 “普通 程序 员 用 迭代 ,天 才 程 序 
员 用 递归 ” 呢 ? 没 错 , 通 过 本 节 的 学 习 , 你 将 了 解 递归 ,通过 独立 完成 课 后 布置 的 练习 ,你 将 彻 
底 摆 脱 递 归 给 你 生活 带 来 的 困扰 ! 

递归 这 个 概念 ,是 算法 的 范畴 ,本 来 不 属于 Python 语言 的 语法 内 容 , 但 小 甲鱼 基本 在 每 
个 编程 语言 系列 教学 里 都 要 讲 递归 , 那 是 因为 如 果 你 掌握 了 递归 的 方法 和 技巧 ,你 会 发 现 这 是 
一 个 非常 棒 的 编程 思路 ! 

那么 递归 算法 在 日 党 编程 中 有 哪些 例子 呢 ? 

汉 诺 塔 游戏 如 图 6-1 所 示 。 


树 结构 的 定义 如 图 6-2 所 示 。 


图 6-2 树 结构 的 定义 
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谢 尔 宾 斯 基 三 角形 如 图 6-3 所 示 。 
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图 6-3 谢 尔 宾 斯 基 三 角形 


女神 自拍 如 图 6-4 所 示 。 


6-4 女神 自拍 


说 了 这 么 多 ,在 编程 上 ,递归 是 什么 这 个 概念 还 没 讲 呢 ! 递归 ,从 原理 上 来 说 就 是 函数 调 
用 自身 这 么 一 个 行为 。 你 没 听 错 , 在 函数 内 部 你 可 以 调用 所 有 可 见 的 函数 ,当然 也 包括 自己 。 
举 个 例子 : 


>>> def recursion(): 
recursion() 


>>> recursion() 
Traceback (most recent call last): 
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File "< pyshell£ 28>", line 1, in < module» 
recursion() 

File "< pyshell # 27>", line 2, in recursion 
return recursion() 

File "< pyshelli 27>", line 2, in recursion 
return recursion() 

File "< pyshell # 27>", line 2, in recursion 


return recursion() 
# 此 处 省 略 超 多 内 容 
RuntimeError: maximum recursion depth exceeded 


这 个 例子 尝试 了 初学 者 玩 递归 最 容易 出 现 的 错误 。 从 理论 上 来 讲 ,这 个 程序 将 永远 执行 
下 去 直至 耗 尽 所 有 内 存 资源 。 不 过 Python3 出 于 “善意 的 保护 ”, 对 递归 的 深度 默认 限制 是 
100 层 , 所 以 你 的 代码 才 会 停 下 来 。 不 过 如 果 你 写 网 络 息 虫 等 工具 ,可 能 会 候 很 深 , 那 你 也 可 
以 日 己 设置 递归 的 深度 限制 。 方 法 如 下 : 

>>> import sys 

>>> sys.setrecursionlimit(1000000) # 将 递归 限制 设置 为 100 J J 

刚才 一 来 就 错误 地 使 用 递归 把 Python 干 择 了 了 ,可见 递归 的 厉害 和 危险 ,这 个 后 边 讲 , 接 
下 来 举 个 正常 的 例子 跟 大 家 完整 解释 一 下 递归 。 噢 ,对 了 ,如 果 你 真 的 设置 了 一 百 万 层 递归 ， 
那么 一 不 小 心 又 玩 脱 了 ,Python 可 能 会 卡 在 那里 很 入, 这 时 你 可 以 通过 Ctrl 十 C 让 它 停止 哦 。 


6.6.2 与 一 个 求 阶 乘 的 函数 


正 整 数 的 阶乘 是 指 从 1 乘 以 2 乘 以 3 乘 以 4 一 直 乘 到 所 要 求 的 数 。 例 如 所 要 求 的 数 是 5， 
则 阶乘 式 是 1X2X3X4X5, 得 到 的 积 是 120, 所 以 120 就 是 5 的 阶乘 。 好 , 那 大 家 先 自 己 尝试 
下 实现 一 个 非 递归 版 本 : 


# p6 5.py 
def recursion(n): 
result = n 
for i in range(1, n): 
result * - i 


return result 


number = int(input( ' 请 输入 一 个 整数 : ')) 
result = recursion(number) 
print(" % d 的 阶乘 是 : d" % (number, result)) 


程序 实现 结果 如 下 : 


>>> 
请 输入 一 个 正 整 数 : 5 
5 的 阶乘 是 : 120 


>>> 
35-38) RAI SC BUR BEC ARERR — P 38 HAE : 
# p6 6.py 
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def factorial(n): 
if n == 1: 
return 1 
else: 


return n x factorial(n- 1) 


number = int(input( "请 输入 一 个 整数 : ')) 
result = factorial(number) 
print("*&d 的 阶乘 是 : &d" % (number, result)) 


以 前 没 接触 过 递归 的 小 伙伴 肯定 会 怀疑 这 是 否 能 正常 执行 ? 没 错 ,这 完全 符合 递归 的 预 
期 和 标准 ,所 以 函数 无 疑 可 以 正确 执行 并 返回 正确 的 结果 ! 程序 实现 结果 跟 上 边 的 结果 是 一 
样 的 : 

222 


请 输入 一 个 正 整数 : 5 
5 的 阶乘 是 : 120 


>>> 

RINK. PRAE NAE AE. ix fI use TAARE: 
(1) HHRH . 

(2) 设置 了 正确 的 返回 条 件 。 

上 面 程序 的 详细 分 析 如 图 6-5 所 示 。 


| factorial( 5) = 5 * factorial( 4 ) P 
|factorial( 4) = 4 * factorial( 3) | 


| factorial( 3 ) = 3 * factorial( 2 ) J, 


factorial( 2 ) = 2 * factorial( 1 ) 
| facioriali ) -1 , 


6-5 递归 函数 的 实现 分 析 


最 后 要 郑重 说 一 下 “普通 程序 员 用 和 迭代, 天才 程 序 员 用 递归 ”这 句 话 是 不 无 道理 的 。 但 是 
你 不 要 理解 错 了 ,不 是 说 会 使 用 递归 ,把 所 有 能 迭代 的 东西 用 递归 来 代 蔡 就 是 天 才 程 序 员 ” 
了 ,恰好 相反 ,如 有 果 你 在 的 这 么 做 的 话 , 那 你 就 是 “ 马 包 程序 员 ” 啦 。 为 什么 这 么 说 呢 ? 不 要 起 
本, 递归 的 实现 可 以 是 函数 日 个 儿 调用 日 个 儿 , 每 次 函数 的 调用 都 需要 进行 压 栈 、 弹 栈 、 保 存 和 
恢复 寄存 大 的 栈 操 作 ,所 以 在 这 上 边 是 非常 消耗 时 间 和 空间 的 。 

妇 外 ,如 有 果 递 归 一 旦 忘记 了 返回 ,或 者 错误 地 设置 了 返回 条 件 ,那么 执行 这 样 的 递归 代码 
就 会 变 成 一 个 无 底 润 : 只 进 不 出 ! 所 以 在 写 递归 代码 的 时 候 , 千 万 要 记 住 口诀 : 递归 递归 , 归 
ERG! 

因此 ,结合 以 上 两 点 致命 缺陷 ,很 多 初学 者 经 常 就 会 在 论坛 上 讨论 递归 存在 的 必要 性 ,他 
们 认为 递归 完全 没 必要 ,用 循环 就 可 以 实现 。 其 实 这 就 跟 讨 论 C 语言 好 还 是 Python 优秀 一 
FE ,是 没有 必要 的 。 因 为 一 样 东 西 既然 能 够 持续 存在 , 那 必 然 有 它 存 在 的 道理 。 递 归 用 在 妙 
处 ,自然 代码 简洁 、 精 练 ,所 以 说 “天 才 程 序 员 使 用 递归 ”。 
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6.6.3 这 帮 小 免 思 子 


地 北 , 总 有 相关 联 的 东西 可 以 拉 过 来 扯淡 。 本 节 就 用 递归 来 实现 斐 波 那 契 (Fibonacci) 数 列 吧 。 
斐 波 那 契 数列 的 发 明 者 ,是 意大利 数学 家 列 昂 纳 多 。 斐 波 那 契 (Leonardo Fibonacci), iX 
老头 说 来 跟 小 甲鱼 也 有 一 定 的 渊源 ,就 是 老 受 拿 动 物 交 配 说 事 儿 ,不 同 的 是 小 甲鱼 注重 过 程 和 
细节 ,而 这 老头 更 关心 结果 ,下 边 就 有 一 个 他 讲 过 的 故事 : 如 果 说 兔子 在 出 生 两 个 月 后 ,就 有 
繁殖 能 力 , 在 拥有 繁殖 能 力 之 后 ,这 对 兔子 每 个 月 能 生出 一 对 小 兔子 来 。 假 设 所 有 兔子 都 不 会 
死去 ,能 够 一 直 于 下 去 ,那么 一 年 之 后 可 以 繁殖 多 少 对 兔子 呢 ? 
我 们 都 知道 兔子 繁殖 能 力 是 惊人 的 ,如 图 6-6 所 示 。 


J 
x 


je — B 
LEA mus 
PA EN 三 月 价 


VV Vy Vy mH" 


图 6-6 3EiE Jp SJ 
数据 统计 如 表 6-1 所 示 。 


表 6-1 斐 波 那 契 数 列 


可 以 用 数学 函数 来 定义 ,如 图 6-7 所 示 。 
E M n=1 时 
Fm)=]1, x n=? 时 
F(n 一 1) 十 F(n 一 2)， 3% n>2 时 
图 6-7 求 斐 波 那 契 数列 的 公式 


假设 需要 求 出 经 历 了 20 个 月 后 ,总 共有 多 少 对 小 兔 串 子 , 不 妨 一 起 考虑 一 下 分 别 用 迭代 
和 递归 如 何 实 现 ? 
迭代 实现 : 


#9 p6 7.py 
def fab(n): 
1 
1 
1 


al 
a2 
a3 
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if nn< 1 
print( ' 输 入 有 误 ! ') 
return - 1 
while (n- 2) » 0: 
a3 al * a2 
al a2 
a2 a3 
n--1 


return a3 


result - fab(20) 
if result != - 1: 
print( ' 总 共有 $%d 对 小 侈 定子 诞生 !' % result) 


接 下 来 看 看 递归 的 实现 原理 ,如 图 6-8 所 示 。 


6-8 递归 实现 斐 波 那 契 数列 的 原理 


递归 实现 : 


# p6 8.py 
def fab(n): 
lf ne 1 
print(' 输 入 有 误 ! ') 
return - 1 
if n == 1 orn == 2: 
return 1 
else: 
return fab(n- 1) + fab(n- 2) 


result - fab(20) 
if result != - 1: 
print(' 总 共有 名 d XJ /]vfa El T WE/E!' % result) 


可 见 逻 辑 非常 简单 ,直接 把 想 的 东西 写成 代码 就 是 递归 算法 了 。 不 过 ,之 前 我 们 总 说 递归 
如 采 使 用 不 当 , 效 率 会 很 低 , 但 是 有 多 低 呢 ? 我 们 这 就 来 证 明 一 下 。 我 们 试图 把 20 个 月 修改 
为 35 个 月 ,然后 试 试看 把 程序 执行 起 来 …… 

发 现 了 吧 ,用 和 迭代 代码 来 实现 基本 是 毫秒 级 的 ,而 用 递归 来 实现 就 考验 你 的 CPU 能 力 啦 
CON FEE — N 分 钟 不 等 ) 。 这 就 是 小 甲鱼 不 支持 大 家 所 有 东西 都 用 递归 求解 的 原因 ,本 来 好 好 的 
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一 个 代码 ,给 你 用 了 递归 ,效率 反而 拉 下 了 一 大 截 。 

为 了 体现 递归 正确 使 用 的 优势 ,下 一 节 我 们 来 谈 谈 利用 递归 解决 汉 诺 塔 难题 。 如 果 你 不 
懂得 递归 ,试图 想 要 写 个 程序 来 解决 问题 是 相当 困难 的 ,但 如 果 使 用 了 递归 ,你 会 发 现 问题 奇 
迹 般 的 变 简单 了 ! 

这 里 可 以 在 线 玩 这 个 游戏 ,大 家 不 妨 边 玩 边 思考 代码 该 怎么 实现 : http://www. 
kaixin001. com/flashgame/game/10406. html, 


6.6.4 汉 诺 塔 


看 过 小 甲鱼 其 他 教程 的 “鱼油 ” 们 可 能 会 说 ,怎么 和 Rab Ros oc ERR CH 
堪 来 举例 呢 ? 没 办 法 ,因为 小 甲鱼 小 时 候 太 笨 了 ,这 个 游戏 老 是 玩 不 过 关 , 好 不 容易 在 自学 编 
程 的 时 候 ,也 卡 在 这 里 好 长 一 段 时 间 , 所 以 呢 , 现 在 懂 了 啊 , 可 以 得 瑟 了 嘛 ! 

汉 诺 塔 (如 图 6-9 所 示 ) 的 来 源 据说 是 这 样 的 : 一 位 法 国 数学 家 曾 编写 过 一 个 印度 的 古老 
传说 : 说 的 是 ,在 世界 中 心 贝 拿 勒 斯 的 圣 庙 里 边 , 有 一 块 黄 铜板 ,上 边 持 着 三 根 宝 针 。 印 度 教 
的 主神 焚 天 在 创造 世界 的 时 候 , 在 其 中 一 根 针 上 从 下 到 上 地 穿 好 了 由 大 到 小 的 64 片 金 片 ,这 
就 是 所 谓 的 汉 诺 塔 。 然 后 不 论 白天 或 者 黑夜 ,总 有 一 个 僧侣 在 按照 下 面 的 法 则 来 移动 这 些 金 
片 :“ 一 次 只 移动 一 片 ,不 管 在 哪 根 针 上 ,小 片 必 须 在 大 片上 面 .规则 很 简单 ,另外 僧侣 们 预 
言 , 当 所 有 的 金 片 都 从 楚 天 穿 好 的 那 根 针 上 移 到 另外 一 根 针 上 时 ,世界 就 将 在 一 声 霹 雳 中 消 
灭 , 而 楚 塔 .庙宇 和 众生 也 都 将 同归于尽 。 


图 6-9 TW 


要 解决 一 个 问题 ,大 家 说 什么 最 重要 ? 没 错 , 思 路 ! 思路 有 了 ,问题 就 可 以 随 之 迎刃而解 。 
洲 戏 上 节 课 我 们 也 玩 了 ,小 甲鱼 可 不 是 让 大 家 日 玩 的 , 玩 过 之 后 大 家 心里 有 底 ,现在 的 分 析 大 
家 才 容 易 听 进去 。 

对 于 游戏 的 玩法 ,可 以 简单 分 解 为 三 个 步骤 : 

(1) 将 前 63 个 盘子 从 X 移动 到 Y 上 ,确保 大 盘 在 小 盘 下 。 

(2) 将 最 底下 的 第 64 个 盘子 从 X 移动 到 Z 上 。 

(3) 将 Y 上 的 63 个 盘子 移动 到 Z E. 

这 样 看 上 去 问题 就 简单 一 点 了 ,有 些 鱼 油 说 小 甲鱼 你 这 不 废话 嘛 1? 有 说 跟 没 说 一 样 ! 因 
为 关键 在 于 步骤 (1) 和 步骤 (3) 应 该 如 何 执行 才 是 让 人 头疼 的 问题 。 

但 是 你 仔细 思考 下 ,在 游戏 中 ,我们 发 现 由 于 每 次 只 能 移动 一 个 圆 盘 ,所 以 在 移动 的 过 程 
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中 显然 要 借助 另外 一 根 针 才 可 以 实施 。 也 就 是 说 ,步骤 (1) 将 1 一 63 个 盘子 需要 借助 之 移 到 Y 


上 ,步骤 (3) 将 立 针 上 的 63 个 盘子 需要 借助 X 移 到 Z 针 上 。 


所 以 把 新 的 思路 聚集 为 以 下 两 个 问题 : 

问题 一 ,将 X 上 的 63 个 盘子 借助 Z 移 到 YY 上; 

问题 二 ,将 Y 上 的 63 SATE XES ZE. 

然后 我 们 惊奇 地 发 现 , 解 决 这 两 个 问题 的 方法 跟 刚 才 第 一 个 问题 的 思路 是 一 样 的 ,都 可 以 


拆 解 成 三 个 步骤 来 实现 。 


问题 一 (将 X 上 的 63 个 盘子 借助 Z 移 到 YY 上) 拆 解 为 : 

CD 将 前 62 个 盘子 从 X 移动 到 Z 上 ,确保 大 盘 在 小 盘 下 。 

(2) 将 最 底下 的 第 63 个 盘子 移动 到 Y 上 。 

(3) 将 Z 上 的 62 个 盘子 移动 到 YY 上。 

问题 二 (将 Y 上 的 63 个 盘子 借助 X 移 到 Z 上 ) 拆 解 为 : 

CD 将 前 62 个 盘子 从 了 移动 到 X 上 ,确保 大 盘 在 小 盘 下 。 

(2) 将 最 底下 的 第 63 个 盘子 移动 到 Z E, 

(3) 将 X 上 的 62 个 盘子 移动 到 Y 上。 

说 到 这 里 ,是 不 是 发 现 了 什么 ? 没 错 , 汉 详 塔 的 拆 解 过 程 刚 好 满足 递归 算法 的 定义 ,因此 ， 


对 于 如 此 难题 ,使 用 递归 来 解决 ,问题 就 变 得 相当 的 人 简单。 参考 代码 : 


# p6 9.py 
def hanoi(n, x, y, z): 
if n == 1: 
print(x, '--» ', z) # 如 果 只 有 一 层 , 直 接 从 x 移 动 到 z 
else: 
hanoi(n- 1, x, z, y) € 将 前 n-1 个 盘子 从 X 移 动 到 Y 上 
print(x，' --> ', z) # 将 最 底下 的 第 64 个 盘子 从 X 移 动 到 Zz 上 
hanoi(n-1, y, x, z) # 将 Y 上 的 63 个 盘子 移动 到 Z 上 


n = int(input(' 请 输入 汉 诺 塔 的 层 数 :')) 
hanoi(n, 'X', 'Y', 'Z') 


看 ,这 就 是 递归 的 魔力 ! 
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9.1 字典 : 当 索 引 不 好 用 时 CE 
[n] i 2 
ARRERA GETTE) dr X PU 18 Ene, ln Ae TED TER ,你 总 不 可 能 从 
字母 a 开始 查找 吧 ? 你 应 该 直接 翻 到 字母 g 在 字典 中 的 位 置 ,然后 接着 找到 gui 的 发 音 , 继 而 
找到 “ 包 ” 字 的 释义 : 广义 上 指 包 整 目 的 统称 ,狭义 上 指 包 科 下 的 物种 。 
在 Python 中 也 有 字典 ,就 拿 刚 才 的 例子 来 说 ,Python 的 字典 把 这 个 字 ( 或 单词 ) 称 为 ^ 键 
(key)”, 把 其 对 应 的 含义 称 为 “ 值 (value)”。 男 外 值得 提 一 下 的 是 ,Python 的 字典 在 有 些 地 方 
称 为 哈 希 (hash) ,有些 地 方 称 为 关系 数组 , 其实 这 些 都 跟 今 天 要 讲 的 Python 字典 是 同一 个 


A 


字典 是 Python HP ME — A Bi E270 , pe pr Je Xe E — 7p Ria. 4 B 
指 两 个 元 素 集 之 间 元 素 相 互 “ 对 应 ”的 关系 ,如 图 7-1 所 示 。 

映射 类 型 区 别 于 序列 类 型 ,序列 类 型 以 数组 的 形式 存储 ,通过 | | 
索引 的 方式 来 获取 相应 位 置 的 值 ,一 般 索 引 值 与 对 应 位 置 存储 的 数 
据 是 毫 无 关系 的 。 举 个 例子 : | à 

>>> brand = ["2E'T", "isi", "阿迪 达 斯 "，" 鱼 C 工作 室 "] 

>>> slogan = [" — gJ f/H nf BE","Just do it"," Impossible is 

nothing", "让 编程 改变 世界 "] 图 7-1 映射 

>>> print(" 鱼 CC 工作 室 的 口号 是 : ", slogan[brand. index(" fá C T. fF 

o — 让 编程 改变 世界 

列表 brand、slogan 的 索引 和 相对 的 值 是 没有 任何 关系 的 ,可 以 看 出 ,唯一 有 联系 的 就 是 
两 个 列表 间 ,索引 号 相同 的 元 素 是 有 关系 的 (品牌 对 应 口号 嘛 ) ,所 以 这 里 通过 "brand. index( 'f& 
C 工作 室 ')” 这 样 的 语句 ,间接 地 实现 通过 品牌 查找 对 应 的 口号 的 功能 。 

这 确实 是 一 种 可 实现 方法 ,但 用 起 来 多 少 有 些 别 扭 , 而 且 效 率 还 不 高 。 襄 且 Python 是 以 
简洁 为 主 , 这 样 的 实现 肯定 是 差强人意 的 。 所 以 ,需要 有 字典 这 种 映射 类 型 的 出 现 。 


7.1.1 创建 和 访问 字典 


先 演示 一 下 用 法 : 


>>> dictl = ("zE-"':"—Jle&an fe", "耐克 ":"Just do it", "阿迪 达 斯 ":"Impossible is nothing", 
" 鱼 C 工 作 室 ":" 让 编程 改变 世界 "} 
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>>> dictl 

{ "李宁 ': 一 切 骨 有 可 能 '，' 阿 迪 达 斯 ': 'Impossible is nothing'，' 鱼 C 工 作 室 ': ' 让 编程 改变 世界 '，' 耐 

克 ': 'Just do it') 

>>> print(" 鱼 C 工 作 室 的 口号 是 : "，dictl[ ' 鱼 C 工 作 室 ']) 

字典 的 使 用 非常 简单 , 它 有 自己 的 标志 性 符号 ,就 是 用 大 括号 ({)) 定 义 。 字 典 由 多 个 键 及 
其 对 应 的 值 共同 构成 ,每 一 对 键 值 组 合 称 为 项 。 在 刚才 的 例子 中 ,“ 李 宁 ”“ 耐 克 ”、…“ 阿 迪 达 
H” “a C 工作 室 ” 这 些 品 牌 就 是 键 , NU "— 9) r8 o AE”, "Just do it", "Impossible is 
nothing”“ 让 编程 改变 世界 这些 口 号 就 是 对 应 的 值 。 眼 尖 的 读者 可 能 已 经 发 现 了 : 字典 中 的 项 
跟 创 建 的 顺序 是 不 一 样 的 ? 没 错 , 字 典 跟 序 列 不 同 , 序 列 讲究 顺序 ,字典 讲究 映射 ,不 讲 顺序 。 

另外 需要 注意 的 是 : 字典 的 键 必 须 独 一 无 二 ,而 值 可 以 取 任 何 数据 类 型 ,但 必须 是 不 可 变 
的 (如 字符 串 、 数 或 元 组 )，。 

要 声明 一 个 空 字典 ,直接 用 个 大 括号 即 可 : 

>>> empty = {} 

>>> empty 

{} 


>>> type(empty) 
«class 'dict > 


你 也 可 以 用 dict() 来 创建 字典 : 


>>> dictl = dict((('F', 70), ('i', 105), ('s', 115), ('h', 104), ('C', 67))) 
>>> dictl 
('s': 115, 'C': 67, 'F': 70, 'h': 104, 'i': 105) 


有 读者 朋友 可 能 会 问 ,为 什么 上 面 的 例子 中 这 么 多 括号 ? 

因为 dictO 图 数 的 参数 可 以 是 一 个 序列 (但 不 能 是 多 个 ) ,所 以 要 打包 成 一 个 元 组 序列 (列表 
也 可 以 )。 当 然 ,如 果 嫌 上 面 的 做 法 太 麻烦 ,还 可 以 通过 提供 具有 映射 关系 的 参数 来 创建 字典 : 

>>> dictl = dict(F- 70, i-105, s- 115, h- 104, C- 67) 


>>> dictl 
(C: 57. '8': 115; 'E': T0, "B: 104, "1: 1051 


这 里 要 注意 的 是 键 的 位 置 不 能 加 上 字符 串 的 引号 ,否则 会 报错 : 


>>> dictl = dict('F'=70, 'i'=105, 's'-115, 'h'= 104, 'C'= 67) 
SyntaxError: keyword can't be an expression 


还 有 一 种 创建 方法 是 直接 给 字典 的 键 赋值 ,如 果 键 存在 , 则 改写 键 对 应 的 值 ; 如 果 不 存 
在 , 则 创建 一 个 新 的 键 并 赋值 : 


>>> dictl 

th 104 "1t: 105} 

>>> dictl['x'] = 88 

>>> dictl 

i'n': 115, Db: 104, '1': 105, 'C': 67, "x: BB, F": 70} 
>>> dictl['x'] = 120 

>>> dictl 

('s': 115, 'h': 104, '1': 105, 'C': 67, 'x': 120, 'F": 70) 


正 所 谓 殊 途 同 归 , 下 面 列 举 的 五 种 方法 都 是 创建 同样 的 字典 ,请 大 家 仔细 体会 下 : 
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>>>a = dict(one- 1, two= 2, three = 3) 

>>> b = ('one':1l, 'two':2, 'three':3] 

>>> c = dict(zip(['one', 'two', 'three'], [1, 2, 3])) 
»»» d = dict([('two', 2), ('one', 1), ('three', 3)]) 
>>> e = dict(('three':3, 'one':1, 'two':2]) 

>> a == þ == çc == d == ẹ 

True 


7.1.2 各 种 内 置 方法 
字典 是 Python 中 唯一 的 映射 类 型 ,字典 不 是 序列 。 如 果 在 序列 中 试图 为 一 Es 


不 存在 的 位 置 赋值 的 时 候 , 会 报错 ; 但 是 如 果 是 在 字典 中 P A MERRE 
值 进去 。 


1. fromkeys() 
fromkeys() 方 法 用 于 创建 并 返回 一 个 新 的 字典 , 它 有 两 个 参数 :第 一 个 参数 是 字典 的 键 ; 


第 二 个 参数 是 可 选 的 ,是 传人 键 对 应 的 值 。 如 果 不 提 供 , 那 么 默认 是 None。 举 个 例子 : 


>>> dictl = {} 

>>> dict1. fromkeys( (1, 2, 3)) 

{1: None, 2: None, 3: None} 

>>> dict2 = {} 

>>> dict2.fromkeys((1, 2, 3), "Number" ) 

(1: 'Number', 2: 'Number', 3: 'Number'} 

>>> dict3 = () 

>>> dict3.fromkeys((1, 2, 3), ("one", "two", "three")) 

(1: ('one', 'two', 'three'), 2: ('one', 'two', 'three'), 3: ('one', 'two', 'three')] 


上 面 最 后 一 个 例子 告诉 我 们 做 事 不 能 总 是 想当然 ,有 时 候 现实 会 给 你 狠 狠 的 一 棒 。 


fromkeys() 方 法 并 不 会 将 值 "one" "two" HI" three" 2r l| WE (EL EE 1,2 和 3, 因为 fromkeys() 把 
("one", "two", "three" ) 当成 一 个 值 了 。 


2. keysO .values() 和 items() 


访问 字典 的 方法 有 keysO 、values() 和 items. 
nn 返回 字典 中 的 键 ,values() 用 于 返回 字典 中 所 有 的 值 ,那么 items() 当 然 就 是 
字典 中 所 有 的 键 值 对 (也 就 是 项 ) 啦 。 举 个 例子 : 


>>> dictl = (] 

>>> dictl = dictl.fromkeys(range(32), "#") 

>>> dictl.keys() 

dict keys([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 
25, 26, 27, 28, 29, 30, 31]) 

>>> dictl. values() 

dict values([ N "Wt, "Pb, "b, E, E, E, UU, UU, HU, UU, E, E, D, TRR, 
Lp o4 X Le oE VE WX dE E UE QE UE QE WE 4E 2 d! 

>>> dictl. items() 

dict items([(0, 5E"), (1, t), (2, E), (3, "PE, (4, P), (5, 0), (6, I), (7, 7), (8, 
7T), (9, 1), (19, FW, (O1, $0, (02, Rh €), 05, 4), 6, 9E), 
(17, R) (18, S): (19, X) (20, X), (21, X) (22, E), (23, P), (24, P), (25, E 
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'),(26，' 赞 ')，(27，' 赞 ')，(28，,，' 赞 ')，(29,' 赞 ')，(30，' 赞 ')，(31，' 赞 ')]) 


字典 可 以 很 大 ,有 些 时 候 我 们 并 不 知道 提供 的 项 是 否 在 字典 中 存在 ,如 果 不 存 在 ,Python 
就 会 报错 : 
>>> print(dictl[32]) 
Traceback (most recent call last): 
File "< pyshell # 17 >", line 1, in «module» 
print(dict1[32]) 
KeyError: 32 


对 于 代码 调试 阶段 ,报错 让 程序 员 及 时 发 现 程序 存在 的 问题 并 修改 之 。 但 是 如 果 程 序 面 
向 用 户 了 ,那么 经 常 报错 的 程序 肯定 会 被 用 户 所 遗弃 …… 


3. get() 


get() 方 法 提供 了 更 宽松 的 方式 去 访问 字典 项 , 当 键 不 存在 的 时 候 ,get() 方 法 并 不 会 报 
错 , 只 是 默默 地 返回 了 一 个 None, 表 示 啥 都 没 找到 : 
>>> dictl.get(31) 
Ld 
>>> dictl.get(32) 
>>> 


如 果 和 希望 找 不 到 数据 时 返回 指定 的 值 ,那么 可 以 在 第 二 个 参数 设置 对 应 的 默认 返回 值 : 
>>> dict1. get(32，" 木 有 ") 

KB 

如 果 不 知 道 一 个 键 是 否 在 字典 中 ,那么 可 以 使 用 成 员 资 格 操作 符 (in 或 not in) 来 判断 ; 


>>> 31 in dictl 
True 

>>> 32 in dict2 
False 


在 字典 中 检查 键 的 成 员 资 格 比 序列 更 高 效 , 当 数据 规模 相当 大 的 时 候 , 两 者 的 差距 会 很 明 
WE: 因为 字典 是 采用 哈 硕 的 方法 一 对 一 找到 成 员 ,而 序列 则 是 采取 迭代 的 方式 逐个 比 对 )。 
最 后 要 注意 的 一 点 是 ,这 里 查找 的 是 键 而 不 是 值 , 但 是 在 序列 中 查找 的 是 元 素 的 值 而 不 是 元 素 
的 索引 。 

如 有 果 需 要 清空 一 个 字典 , 则 使 用 clear() 方 法 : 

>>> dictl 

(0: 0,1: ' 赞 ',，2: 04 3: L4: E. 5: ' 赞 '， 6: ' 赞 ', 7: 0:8: 0:9: ' 赞 '，10: E, 11: 

UE 12: ' 赞 ',， 13: t, 14: ' 赞 ', 15: t, 16: 05, 17: 0,18: 5, 19: 08,20: 921: E, 

22: ' 赞 '，23: "t; 24: ' 赞 '，25: 0,26: 027: ' 赞 '，28: ' 赞 '，29: '#', 30: '#', 31: EJ 

>>> dictl.clear() 


>>> dictl 


ü 
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端 。 举 个 例子 跟 大 家 说 说 两 种 清除 方法 有 什么 不 同 : 
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>>> a = {" 姓 名 ":" 小 甲鱼 "} 
>>>b= a 

>>>b 

{' 姓 名 ': ' 小 甲鱼 '} 

>>>a = {} 

>>> a 


ü 


>>> b 

Ct: ' 小 甲鱼 '} 

从 上 面 的 例子 中 可 以 看 到 ,a、b 指 问 同一 个 字典 ,然后 试图 通过 将 a 重新 指 问 一 个 空 字典 
来 达到 清空 的 效 末 时 ,我 们 发 现 原 来 的 字典 并 没有 被 真正 清空 ,只 是 a 指 癌 了 一 个 新 的 字典 
而 已 。 所 以 这 种 做 法 在 一 定 条 件 下 会 留 下 安全 隐患 (例如 ,账户 的 数据 和 密码 等 资料 有 可 能 会 
DDO. 

推荐 的 做 法 是 使 用 clear() 方 法 : 


>>> a = {" 姓 名 ":" 小 甲鱼 "} 
>>>b = a 

>>> b 

{' 姓 名 ': ' 小 甲鱼 '} 

>>> a.clear() 

>>> a 

{} 

>>> b 

ü 

4. copy() 
copy() 方 法 是 复制 字典 . 


>>>a = (1:"one", 2:"two", 3:"three"] 
>>> b = a.copy() 

>>> id(a) 

63239624 

>>> id(b) 

63239688 

>>> a[1] = "four" 

>>> a 

{1: 'four', 2: 'two', 3: 'three'} 
b 

(1: 'one', 2: 'two', 3: 'three'] 


5. popO A popitem() 


接 下 来 讲 讲 popO fll popitemO ,pop() 是 给 定 键 弹出 对 应 的 值 , 而 popitem() 是 弹出 一 
项 ,这 两 个 比较 容易 : 


>>>a = (1:"one", 2:"two", 3:"three", 4:"four"} 
>>> a.pop(2) 

'two' 

>>> a 

{1: 'one', 3: 'three', 4: 'four'} 

>>> a. popitem( ) 
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(1, 'one") 

>>> a 

{3: 'three', 4: 'four'} 

setdefaultO Jj i 4l get() 方 法 有 点 相似 ,但 是 setdefault() 在 字典 中 找 不 到 相应 的 键 时 会 
自动 添加 : 

>>>a = (1:"one", 2:"two", 3:"three", 4:"four"} 

>>> a. setdefault(3) 

'three' 

>>> a. setdefault(5) 

>>> a 

{1: 'one', 2: 'two', 3: 'three', 4: 'four', 5: None} 


6. update() 
最 后 一 个 是 update() 方 法 ,可 以 利用 它 来 更 新 字典. 


>>> pets = (TRAT ÆR", "汤姆 ":" 猫 "," 小 白 ":" 猪 "} 

>>> pets. update( 小 白 =" 狗 ") 

>>> pets 

{ 米奇 ': ER, USB ' 猫 '，' 小 白 ': ' 狗 '} 

还 记得 在 6.2 节 的 末尾 我 们 埋 下 了 一 个 伏笔 ,在 末尾 讲 到 收集 参数 的 时 候 , 我 们 说 
Python 还 有 男 一 种 收集 方式 ,就 是 用 两 个 星 号 ( xx ) 表 示 。 两 个 星 号 的 收集 参数 表示 为 将 参 
数 们 打包 成 字典 的 形式 ,现在 讲 到 了 字典 ,就 顺理成章 地 给 大 家 讲 讲 吧 。 

收集 参数 其 实 有 两 种 打包 形式 : 一 种 是 以 元 组 的 形式 打包 , 男 一 种 则 是 以 字典 的 形式 
打包 : 

>>> def test( * * params): 

print(" 有 vd 个 参数 " % len(params)) 
print(" 它 们 分 别 是 : ", params) 


>>> test(a=1, b=2, c=3, d=4, e=5) 


有 5 个 参数 
它们 分 别 是 : {'d': 4, 'e': 5, 'b': 2, 'c': 3, "a": 1} 
当 参 数 市 两 个 星 号 ( xx ) 时 ,传递 给 因数 的 任意 个 key — value 实 参 会 被 打包 进 一 个 字典 


十 


那么 有 打包 就 有 解 包 ,来 看 一 个 例子 : 


>>> a = ("one":1, "two":2, "three":3) 

>>> test( * *a) 

有 3 个 参数 

它们 分 别 是 : ('three': 3, 'one': 1, 'two': 2) 


7.2 集合 : 在 我 的 世界 里 ,你 就 是 唯一 


上 节 讲 了 Python 中 的 字典 Hn 的 字典 是 对 数学 中 映射 概念 支持 的 直接 体现 。 而 今 
天 呢 , 我 们 请 来 了 字典 的 表亲 : 
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We? 难道 它们 长 得 很 像 ? 来 ,大 家 看 下 代码 : 


>>> numl = {} 
>>> type(num1) 
«class 'dict > 
>>> num2 = (1,2,3,4, 5] 
>>> type(num2) 
«class 'set'> 


你 们 确实 没有 眼花 ,在 Python3 里 ,如 条 用 大 括号 括 起 一 堆 数 字 但 没有 体现 映射 关系 , 那 
4 Python 就 会 认为 这 堆 玩 意 儿 就 是 个 集合 。 

那 集合 有 什么 特色 呢 ? 不 知道 大 家 有 没有 注意 到 本 节 的 标题 一 “集合 : 在 我 的 世界 里 ， 
你 就 是 唯一 ”? 

好 ,说 回 主题 ,集合 在 Python 中 几乎 起 到 的 所 有 作用 就 是 两 个 字 : 唯一 。 举 个 例子 : 

>>> num = {1, 2, 3,4 ,5, 4, 3, 2, 1] 


>>> num 
(1, 2, 3, 4, 5) 


大 家 看 到 ,我们 根本 不 需要 做 什么 ,集合 就 会 帮 我 们 把 重复 的 数据 清理 掉 , 这 样 是 不 是 很 
方便 呢 ? 但 要 注意 的 是 ,集合 是 无 序 的 ,也 就 是 你 不 能 试图 去 索引 集合 中 的 某 一 个 元 素 : 


>>> num[2] 
Traceback (most recent call last): 
File "< pyshell£81»", line 1, in < module» 
num[ 2] 
TypeError: 'set'object does not support indexing 


7.2.1 创建 集合 


创建 集合 有 两 种 方法 : 一 种 是 直接 把 一 堆 元 素 用 大 括号 ((})) 括 起 来 ; 男 一 种 是 用 set()。 


>>> setl = {" 小 甲鱼 ",， Ya", "小 护士 "," 小 甲鱼 "} 

>>> set2 = set([" 小 甲鱼 ", "EE fan, "小 护士 "," 小 甲鱼 "]) 
>>> setl == set2 

True 


现在 要 求 去 除 列表 [1, 2, 3, 4, 5, 5, 3, 1, 0] 中 重复 的 元 素 。 如 果 还 没有 学 习 过 集合 ， 


你 可 能 会 这 么 与 : 


So Totl EL 3,4. 5. 5, 3, 1, UH 
>>> temp = listl[:] 
>>> listl.clear() 
>>> for each in temp: 
if each not in listl: 
listl.append(each) 


>>> listl 
[1, 2; 3, 4, Ja 0] 


当 你 学 习 了 集合 之 后 ,就 可 以 这 么 干 : 


e 78 o 


ss» Hasti = [1,2, 3, 4, 5, 5, 3, 1, 0] 

>>> listl - list(set(listl)) 

>>> listl 

ID, 1, 2; S». 4. 5] 

看 ,知识 才 是 第 一 生产 力 ! 不 过 大 家 发 现 没有 ? 由 于 set() 创 造 了 的 集合 内 部 是 无 序 的 ， 
所 以 再 调用 list() 将 无 序 的 集合 转换 成 列表 就 不 能 保证 原来 的 列表 的 顺序 了 (这 里 Python 好 
心 办 坏事 儿 ,把 0 放 到 前 边 了 ) ,所 以 如 果 关 注 列 表 中 元 素 的 前 后 顺序 问题 ,使 用 set O 3X 1 PR 
数 时 就 要 提高 警惕 啦 ! 


7.2.2 访问 集合 


由 于 集合 中 的 元 系 是 无 序 的 ,所 以 并 不 能 像 序 列 那 样 用 下 标 来 进行 访问 ,但 是 可 以 使 用 达 
代 把 集合 中 的 数据 一 个 个 读 取 出 来 : 


>>> Setl = (1,2, 3, 4, 5, 4, 3, 2, 1, 0] 
>>> for each in setl: 


print(each, end- '') 
012345 
当然 也 可 以 使 用 in 和 not in 判断 一 个 元 素 是 否 在 集合 中 已 经 存在 : 


>>> 0 in setl 

True 

>>> 'oo'in setl 
False 

>>> 'xx'not in setl 
True 


使 用 add() 方 法 可 以 为 集合 添加 元 素 ,使 用 remove() 方 法 可 以 删除 集合 中 已 知 的 元 素 : 


>>> setl.add(6) 

>>> setl 

(0, 1, 2, 3, 4, 5, 6) 
>>> setl.remove(5) 
>>> setl 

(0, 1, 2, 3, 4, 6) 
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有 些 时 候 希 望 集合 中 的 数据 具有 稳定 性 ,也 就 是 说 , 像 元 组 一 样 不 能 随意 地 增加 或 删除 集 
合 中 的 元 素 。 那 么 我 们 可 以 定义 不 可 变 集 合 , 这 里 使 用 的 是 frozenset() 函 数 , 没 错 , 就 是 把 元 
素 给 frozen( 冰 冻 ) 起 来 : 


>>> setl = frozenset({1, 2, 3, 4, 5}) 
>>> setl.add(6) 
Traceback (most recent call last): 
File "<pyshell#112>", line 1, in <module> 
Setl. add(6 ) 
AttributeError: 'frozenset' object has no attribute 'add' 
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8.1 文件 : 因为 懂 你 ,所 以 永恒 
[n] i7 


大 多 数 的 程序 都 遵循 着 : 输入 -二 处 理 -二 输出 的 模型 ,首先 接收 输入 数据 ,然后 按照 要 求 
进行 处 理 , 最 后 输出 数据 。 到 目前 为 止 ,我 们 已 经 很 好 地 了 解 了 如 何 处 理 数据 ,然后 打印 出 需 
要 的 结果 。 不 过 你 可 能 已 经 上 胃口 大 开 ,不 再 只 满足 于 使 用 input 接收 用 户 输入 ,使 用 print 输 
出 处 理 绪 有 末了 。 你 迫切 想 要 的 是 关注 到 系统 的 方方面面 ,你 需要 目 己 的 代码 可 以 目 动 分 析 
系统 的 日 志 , 你 需要 分 析 的 结果 可 以 保存 为 一 个 新 的 日 志 , 甚 至 你 需要 跟 外 面 的 世界 进行 


相信 大 家 都 曾经 有 这 样 的 经 历 : 当 你 在 编写 代码 与 起 劲 儿 的 时 候 , 系 统 突 然 蓝屏 毅 温 


| r 
"x. 


等 等 。 

在 你 编写 代码 的 时 候 , 操 作 系 统 为 了 更 快 地 做 出 响应 ,把 所 有 当前 的 数据 都 放 在 内 存 中 ， 
因为 内 存 和 CPU 数据 传输 的 速度 要 比 在 硬盘 和 CPU 之 间 传 输 的 速度 快 很 多 倍 。 但 内 存 有 
一 个 天 生 的 不 足 , 就 是 一 旦 断 电 就 没戏 ,所 以 小 甲鱼 在 这 里 再 一 次 呼吁 广大 未 来 即将 成 为 伟大 
程序 员 的 读者 们 : 请 养 成 一 个 优雅 的 习惯 ,随时 使 用 快捷 键 Ctrl 十 S 保存 你 的 数据 。 

由 于 Windows 是 以 扩展 名 来 指出 文件 是 什么 类 型 ,所 以 相信 很 多 习惯 使 用 Windows 的 
朋友 很 快 就 反应 过 来 了 ,.exe 是 可 执行 文件 格式 ,. txt 是 文本 文件 ,. ppt 是 PowerPoint ff) 
用 格式 …… 所 有 这 些 都 称 为 文件 。 


8.1.1 打开 文件 
在 Python 中 ,使 用 open() 这 个 函数 来 打开 文件 并 返回 文件 对 象 : 


open(file，mode = 'r', buffering = - 1, encoding = None, errors = None, newline = None, closefd = 

True, opener - None) 

open() 这 个 函数 有 很 多 参数 ,但 作为 初学 者 的 我 们 ,只 需要 先 关 注 第 一 个 和 第 二 个 参数 
即 可 。 第 一 个 参数 是 传 入 的 文件 名 ,如 果 只 有 文件 名 ,不 带路 径 的 话 ,那么 Python 会 在 当前 
文件 夹 中 去 找到 该 文件 并 打开 。 有 的 读者 可 能 会 问 : 如 果 我 要 打开 的 文件 事实 上 并 不 存 
在 呢 ? 

那 就 要 看 第 二 个 参数 了 ,第 二 个 参数 指定 文件 打开 模式 ,如 表 8-1 所 示 。 
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X 8-1 文件 的 打开 模式 
打开 模式 执行 操作 
以 只 读 方式 打开 文件 (默认 ) 
以 写 入 的 方式 打开 文件 ,会 覆盖 已 存在 的 文件 


M" 


wo 
'x' 如 果 文 件 已 经 存在 ,使 用 此 模式 打开 将 引发 异常 

'a' 以 写 入 模式 打开 ,如 果 文 件 存在 , 则 在 末尾 追加 写 入 
'b' 以 二 进 制 模式 打开 文件 

't' 以 文本 模式 打开 (默认 ) 

' 十 ' 可 读 写 模式 (可 添加 到 其 他 模式 中 使 用 ) 

Er 通用 换行 符 支 持 


使 用 open() 成 功 打开 一 个 文件 之 后 , 它 会 返回 一 个 文件 对 象 , 拿 到 这 个 文件 对 象 ,就 可 以 
谈 取 或 修改 这 个 文件 : 


>> £ 先 将 record. txt 文件 放 到 Python 的 根 目录 下 (如 C:\Python34) 


>>> f = open("record. txt") 
没有 消息 就 是 好 消息 ,说 明 我 们 的 文件 成 功 被 打开 了 。 
8.1.2 文件 对 象 的 方法 


打开 文件 并 取得 文件 对 象 之 后 ,就 可 以 利用 文件 对 象 的 一 些 方法 对 文件 进行 读 取 或 修改 
等 操作 。 表 8-2 列举 了 平时 常用 的 一 些 文件 对 象 方法 。 
表 8-2 文件 对 象 方法 


文件 对 象 的 方法 执行 操作 
close() 关闭 文件 
T— 从 文件 读 取 size 个 字符 , 当 未 给 定 size 或 给 定 负 值 的 时 候 , 读 取 剩 余 的 所 有 字符 , 然 
后 作为 字符 串 返 回 
readline() 从 文件 中 读 取 一 整 行 字 符 串 
writeCstr) 将 字符 串 str 写 人 文件 


writelines(seq) 向 文件 写 人 字符 串 序 列 seq,seq 应 该 是 一 个 返回 字符 串 的 可 迭代 对 象 
在 文件 中 移动 文件 指针 ,从 fromCo 代表 文件 起 始 位 置 ,1 代表 当前 位 置 ,2 代表 文件 
末尾 ) 偏 移 offset 个 字 节 

tell() 返回 当前 在 文件 中 的 位 置 


seekCoffset. from) 


8.1.3 文件 的 关闭 


close() 方 法 用 于 关闭 文件 。 如 果 是 讲 C 语言 编程 教学 ,小 甲鱼 一 定 会 一 万 次 地 强调 文件 
的 关闭 非常 重要 。 而 Python 拥有 垃圾 收集 机 制 ,会 在 文件 对 象 的 引用 计数 降 至 零 的 时 候 上 月 
动 关闭 文件 ,所 以 在 Python 编程 里 , 如果 忘记 关闭 文件 并 不 会 造成 内 存 泄露 那么 危险 的 
结果 。 

但 并 不 是 说 就 可 以 不 要 关闭 文件 ,如 果 你 对 文件 进行 了 写 人 操作 ,那么 应 该 在 完成 写 人 之 
后 关闭 文件 。 因 为 Python 可 能 会 缓存 你 写 入 的 数据 ,如 果 中 途 发 生 类 似 断 电 之 类 的 事故 , 那 
些 缓存 的 数据 根本 就 不 会 写 入 到 文件 中 。 所 以 ,为 了 安全 起 见 , 要 养 成 使 用 完 文 件 后 立刻 关闭 
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8.1.4 文件 的 读 取 和 定位 


文件 的 读 取 方法 很 多 ,可 以 使 用 文件 对 象 的 read() 和 readline() 方 法 ,也 可 以 直接 list(f) 
或 者 直接 使 用 迭代 来 读 取 。read() 是 按 字 节 为 单位 读 取 ,如 果 不 设置 参数 ,那么 会 全 部 读 取 出 
来 ,文件 指针 指向 文件 末尾 。tell0O 〇 ) 方 法 可 以 告诉 你 当前 文件 指针 的 位 置 : 


>>> f.read() 

小 客服 :小 甲鱼 ,有 个 好 评 很 好 笑 哈 .\n 小 甲鱼 : 哦 ?\n 小 客服 :" 有 了 小 甲鱼 ,以 后 妈妈 再 也 不 用 担心 我 
的 学 习 了 一 "\n 小 甲鱼 :哈哈 哈 , 我 看 到 咱 ,我 还 发 微 博 了 呢 一 \n 小 客服 : 嗯 嗯 ,我 看 了 你 的 微 博 昨 一 \n 
小 甲鱼 :OK 一 \n 小 客服 :那个 有 条 回复 "左手 拿 着 小 甲鱼 , 右手 拿 着 打火机 ,哪里 不 会 点 哪里 , so easy 
5 Aon 小 甲鱼 :IT T 

>>> f.tell() 

284 


刚才 提 到 的 文件 指针 是 喻 ?你 可 以 认为 它 是 一 个 “书签 ”, 起 到 定位 的 作用 。 使 用 seekO 
方法 可 以 调整 文件 指针 的 位 置 。seek(offset, from) 方 法 有 两 个 参数 ,表示 从 from(0 代表 文 
件 起 始 位 置 ,1 代表 当前 位 置 ,2 代表 文件 末尾 ) 偏 移 offset 字 节 。 因 此 将 文件 指针 设置 到 文件 
起 始 位 置 ,使 用 seek(0, 0) 即 可 : 


>>> f.tell() 

284 

>>> f.seek(0, 0) 
0 

>>> f.read(5) 
小 客服 :小 ' 

>>> f.tell() 

9 


GE: 因为 1 个 中 文字 符 占 用 2 个 字 节 的 空间 ,所 以 4 个 中 文 加 工 个 英文 骨 号 刚好 到 位 
H9) 

readline() 方 法 用 于 在 文件 中 谈 取 一 整 行 ,就 是 从 文件 指针 的 位 置 加 后 读 取 ,直到 遇 到 换 
行 符 (\n) 结 束 : 


>>> f.readline() 


' 甲 鱼 , 有 个 好 评 很 好 筑 哈 .\n' 

此 前 介绍 过 列表 的 强大 ,说 什么 都 可 以 往 里 放 , 这 不 ,也 可 以 把 整个 文件 的 内 容 放 到 列 
KP: 

>>> list(f) 

[' 小 甲鱼 : 哦 ?\n'，' 小 客服 :" 有 了 小 甲鱼 ,以 后 妈妈 再 也 不 用 担心 我 的 学 习 了 一 "\n'，' 小 甲鱼 :哈哈 哈 ， 

我 看 到 咯 , 我 还 发 微 博 了 呢 一 \n'，' 小 客服 : 嗯 嗯 ,我 看 了 你 的 微 博 昨 一 \n'，' 小 甲鱼 :OK 一 \n'， ' 小 客服 : 

那个 有 条 回复 "左手 拿 着 小 甲鱼 ,右手 拿 着 打火机 ,哪里 不 会 点 哪里 , so easy ^ ^"\n'，' 小 甲鱼 :T_T'] 

对 于 迭代 读 取 文本 文件 中 的 每 一 行 ,有 些 读者 可 能 会 这 么 写 : 


>>> f.seek(0, 0) 
0 
>>> lines = list(f) 
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>>> for each line in lines: 
print(each line) 


这 样 写 并 没有 错 , 但 给 人 的 感觉 就 像 是 你 拿 酒精 灯 去 烧 开 水 ,水 是 烧 得 开 , 不 过 效率 不 是 
很 高 。 因 为 文件 对 象 自身 是 支持 迭代 的 ,所 以 没 必 要 绕 圈 子 ,直接 使 用 for 语句 把 内 容 迭 代 读 


>>> f.seek(0, 0) 

0 

>>> for each line in f: 
print(each line) 


8.1.5 文件 的 写 入 
如 果 需 要 写 入 文件 ,请 确保 之 前 的 打开 模式 有 'w' 或 'a', 和 否则 会 出 错 : 


>>> f = open("record. txt") 

>>> f.write(" 这 是 一 段 待 写 人 的 数据 ”) 

Traceback (most recent call last): 

File "< pyshell£ 135»", line 1, in < module» 

f.write(" 这 是 一 段 待 写 人 的 数据 ”) 

io.UnsupportedOperation: not writable 

>>> f.close() 

>>> f = open("record.txt", "w") 

>>> f. write(" 这 是 一 段 待 写 人 的 数据 ") 

10 

>>> f.close() 


然而 一 定 要 小 心 的 是 : 使 用 'w' 模 式 写 入 文件 ,此 前 的 文件 内 容 会 被 全 部 删除 ! 如 图 8-1 
所 示 ,小 甲鱼 和 小 客服 的 对 话 备份 已 经 不 在 了 。 


E record.txt - 记事 本 MESE ES 
文件 (F) 编辑 (E) 格式 (D) 查看 (V) 帮助 (H) 
这 是 一 段 待 写 入 的 数据 E 


8-1 '"w' 打 开 模 式 会 删除 原来 的 文件 内 容 
如 果 要 在 原来 的 内 容 上 追加 ,一 定 要 使 用 'a' 模 式 打开 文件 哦 。 这 是 血淋淋 的 教训 ,不 要 问 


我 为 什么 ( 想 想 都 是 泪 啊 )! 
Bni-6— — E 


本 节 要 求 读者 朋友 独立 来 完成 一 个 任务 一 将 文件 (record2. tx rp fiie t a 
行 分 割 并 按照 以 下 规则 保存 起 来 : 
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CD 将 小 甲鱼 的 对 话 单独 保存 为 boy * . txt 的 文件 (去 掉 * 小 甲鱼 :”) 。 

(2) 将 小 客服 的 对 话 单独 保存 为 girl. * .txt 的 文件 (去 掉 “ 小 客服 :”)。 

(3) 文件 中 总 共有 三 段 对 话 ,分别 保存 为 boy 1. txt, girl. 1. txt, boy. 2. txt, girl 2. txt, 
boy_3. txt girl_3. txt JE 6 个 文件 (提示 : 文件 中 不 同 的 对 话 间 已 经 使 用 "三 三 三 三 三 三 一 一 


一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 分 制 )。 
大 家 一 定 要 目 己 先 动 动手 册 参 考 答 案 哦 : 
# p8_1.py 
count = 1 
boy = [] 
girl = [] 


f = open('record.txt') 
for each line in f: 
if each line[:6] != '== == == '; 
(role, line spoken) = each line.split(':', 1) 
if role == ' 小 甲鱼 ': 
boy.append(line spoken) 
if role == ' 小 客服 ': 
girl.append(line spoken) 
else: 
file name boy = 'boy ' + str(count) + '.txt' 
file name girl = 'girl ' + str(count) + '.txt' 
boy file = open(file name boy, 'w') 
girl file - open(file name girl, 'w') 
boy file.writelines(boy) 
girl file.writelines(girl) 
boy - [] 
girl - [] 
count += 1 
file name boy = 'boy ' + str(count) + '.txt' 
file name girl = 'girl ' + str(count) + '.txt' 
boy file - open(file name boy, 'w') 
girl file = open(file name girl, 'w') 
boy file.writelines(boy) 
girl file.writelines(girl) 
boy file.close() 
girl file.close() 
f.close() 


事实 上 可 以 利用 函数 封装 得 更 好 看 一 些 . 


# p8 2.py 
def save file(boy, girl, count): 
file name boy = 'boy ' + str(count) + '.txt' 
file name girl = 'girl ' + str(count) + '.txt' 
boy file = open(file name boy, 'w') 
girl file - open(file name girl, 'w') 
boy file.writelines(boy) 
girl file.writelines(girl) 
boy file.close() 
girl file.close() 


« 84 。 


662 xut n» 


def split file(file name): 


count - 1 
boy - [] 
girl - [] 


f = open(file name) 
for each line in f: 
if each line[:6] != '== == == '; 
(role, line spoken) = each line.split(':', 1) 
if role == ' 小 甲鱼 ': 
boy.append(line spoken) 
if role == ' 小 客服 ': 
girl.append(line spoken) 
else: 
save file(boy, girl, count) 
boy = [] 
girl = [] 
count += 1 
save file(boy, girl, count) 
f.close() 
split file( 'record. txt') 


8.2 文件 系统 : 介绍 一 个 高 大 上 的 东西 


接 下 来 会 介绍 跟 Python 的 文件 相关 的 一 些 十 分 有 用 的 模块 。 模 块 是 什么 ?其 实 我 们 写 


的 每 一 个 源 代 码 文件 (* . py) 都 是 一 个 模块 。Python 自身 带 有 非常 多 实用 的 模块 ,在 日 常 编 
程 中 ,如 采 能 够 熟练 地 车 握 它们 ,将 事半功倍 。 


比如 刚 开 始 介 绍 的 文字 小 游戏 ,里 边 就 用 random 模块 的 randint O A coe ^E jV Bii BL 2C. 


然而 要 使 用 这 个 randint() 函数 ,直接 就 调用 可 不 行 : 


>>> random. randint(0, 9) 
Traceback (most recent call last): 
File "<pyshell# 140>", line 1, in <module> 
random. randint(0, 9) 
NameError: name 'random' is not defined 


正确 的 做 法 应 该 是 先 使 用 import 语句 导入 模块 ,然后 再 使 用 : 


>>> import random 

>>> random. randint(0, 9) 
3 

>>> random. randint(0, 9) 
1 

>>> random. randint(0, 9) 
8 


首先 要 介绍 的 是 高 大 上 的 OS 模块 ,OS 就 是 Operating System 的 缩写 ,意思 是 操作 系统 ， 


而 平时 经 常 说 OS 就 是 iPhone OS 的 意思 , 即 苹果 手机 的 操作 系统 。 但 这 里 小 甲鱼 说 OS Bi 
Bs X E ,并 不 是 因为 跟 苹果 或 土 紧 金 拉 边 才 这 人 么 说 。 之 所 以 说 OS 模块 高 大 上 ,是 因为 对 于 
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文件 系统 的 访问 ,Python 一 般 是 通过 OS 模块 来 实现 的 。 我 们 所 知道 第 用 的 操作 系统 就 有 
Windows, Mac OS, Linux, UNIX 等 ,这 些 操作 系统 底层 对 于 文件 系统 的 访问 工作 原理 是 不 一 
样 的 ,因此 你 可 能 就 要 针对 不 同 的 系统 来 考虑 使 用 哪些 文件 系统 模块 ……… 这 样 的 做 法 是 非常 
不 友好 且 肤 烦 的 ,因为 这 意味 看 当 你 的 程序 运行 环境 一 旦 改变 ,你 就 要 相应 地 去 修改 大 量 的 代 


人 码 来 应 付 。 


但 是 Python 是 跨 平 台 的 语言 ,也 就 是 说 ,同样 的 源 代码 在 不 同 的 操作 系统 不 需要 修改 就 
可 以 同样 实现 。 有 了 OS 模块 ,不 需要 关心 什么 操作 系统 下 使 用 什么 模块 ,OS 模块 会 帮 你 选 
择 正确 的 模块 并 调用 。 

X 8-3 列举 了 OS 模块 中 关于 文件 /目录 常用 的 防 数 使 用 方法 。 


E X 名 
getcwd() 
chdir( path) 
listdir( path= '. ') 
mkdir( path) 


makedirs( path) 


remove( path) 
rmdir( path) 
removedirs( path) 
rename(old, new) 


system( command) 


X 8-3 OS 模块 中 关于 文件 /目录 常用 的 函数 使 用 方法 


使 用 方法 


返回 当前 工作 目录 

改变 工作 目录 

列举 指定 目录 中 的 文件 名 ('. ' 表 示 当 前 目录 ,'.. ' 表 示 上 一 级 目录 ) 

创建 单 层 目 录 , 如 该 目录 已 存在 抛 出 异常 

递归 创建 多 层 目录 ,如 果 该 目录 已 存在 则 抛 出 异常 ,注意 : 'E:\\a\\b' 和 'E:\\a\\c' 并 
不 会 冲突 

删除 文件 

删除 单 层 目录 ,如 果 该 目录 非 空 则 抛 出 异常 

递归 删除 目录 ,从 子 目录 到 父 目 录 逐 层 尝 试 删 除 , 遇 到 目录 非 空 则 抛 出 异常 
将 文件 old 重 命名 为 new 

运行 系统 的 shell 命令 


以 下 是 支持 路 径 操 作 中 常用 到 的 一 些 定义 ,支持 所 有 平台 


OS. curdir 


OS. pardir 


OS. sep 


os. linesep 


OS. name 


1. getcwd() 


指 代 当 前 目录 ('.') 

指 代 上 一 级 目录 ('..') 

输出 操作 系统 特定 的 路 径 分 隔 符 (在 Windows 下 为 \\ Linux 下 为 "/) 
当前 平台 使 用 的 行 终 止 符 ( 在 Windows 下 为 \r\n',Linux 下 为 \n') 

指 代 当前 使 用 的 操作 系统 (包括 'posix'、'nt'、'mac'、'0s2'、'ce'、 java) 


在 有 些 情况 下 我 们 需要 获得 应 用 程序 当前 的 工作 目录 (比如 要 保存 临时 文件 ) ,那么 可 以 
使 用 getewd O AGRIS : 


>>> import os 
>>> os.getcwd( ) 


'C:\\Python34' 


2. chdir( path) 


用 chdirO eR ZI uf EL BE A TAE Boe. ron up EL) S S E S 


» os. chdir("E:\\") 


>>> os.getcwd( ) 


'E:NN' 
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3. listdir(path- '. ') 


有 时 候 你 可 能 需要 知道 当前 目录 下 有 哪些 文件 和 子 目 录 , 那 么 listdir() 函 数 可 以 帮 你 列 
举 出 来 。path 参数 用 于 指定 列举 的 目录 ,默认 值 是 '.', 代 表 根 目录 ,也 可 以 使 用 '.. ' 代 表 上 一 
层 目 录 : 


>>> os. listdir() 

['$ RECYCLE. BIN', 'Arduino', 'System Volume Information'，' 工 作 室 '，' 工 具 箱 '，' 鱼 C 光 盘 '，' 鱼 C 工 作 
室 编 程 教学 '] 

>>> os. listdir("C:\\") 

[' $ 360Section', '$ Recycle. Bin', '360SANDBOX', 'Boot', 'bootmgr', 'BOOTNXT', 'DkHyperbootSync', 
'Documents and Settings', 'hiberfil. sys', 'Intel', 'iSee', 'mfg', 'MSOCache', 'OneDriveTemp', 
'pagefile.sys', 'PerfLogs', 'Program Files', 'Program Files (x86)', 'ProgramData', 'Python27', 
'"Python34', '"Recovery', 'Recovery.txt', 'swapfile.sys', System Volume Information', Users', Windows 


) 
4. mkdir( path) 


mkdir O PR ZH] FEEFFE . t x c Ee Tr dE d iH FileExistsError 异常 : 


>>> os.mkdir("test") 
>>> os.listdir() 
[' $ RECYCLE. BIN', 'Arduino', 'System Volume Information', 'test'  LÍE*', ' 工 具 箱 '，' 鱼 C 光 盘 '， ' 
鱼 C 工 作 室 编程 教学 '] 
>>> os. mkdir("test") 
Traceback (most recent call last): 
File "<pyshell#156>", line 1, in <module> 
os. mkdir("test") 
FileExistsError: [WinError 183] 当 文 件 已 存在 时 ,无 法 创建 该 文件 . : 'test' 


5. makedirs( path) 
makedirs CO PR Zi nf DAR] T 8] 28 & JHK: 


» 4& OneDrive 
>>> os. makedirs(r".\a\b\c") ET 
效果 如 图 8-2 所 示 。 4 WM 这 台 
pg Uum 

6. remove( path) , rmdir( path) 3H removedirs( path) >È BR 

remove() 函 数 用 于 删除 指定 的 文件 ,注意 是 删除 文件 ，| “卓文 
不 是 删除 目录 。 如 果 要 删除 目录 , 则 用 rmdir() 函 数 ， 如 果 要 | “六 于 
删除 多 层 目 录 , 则 用 removedirsO rR » m pd 

so oa. Tiseieti » £5 Windows8_OS (C:) 

['a', 'b', 'test. txt '] 4 x» FishC (D:) 


>> # 当前 工作 目录 结构 为 a\bN\c, PN\,test.txt Ala 
>>> os. remove( "test. txt") 
>>> os. rmdir("b") 

>>> os. removedirs(r"a\b\c") 


>>> os.listdir() 
了 istdir( 图 8-2  makedirsO 函数 
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7. rename(Cold. new) 


renameO KUH T E dn 44 C Tp eX OCT X : 


>>> os. listdir() 

['a', 'a.txt'] 

>>> os. rename( "a", "b") 

>>> os. rename( "a. txt", "b. txt") 
>>> os. listdir() 

['b', 'b.txt'] 


8. system( command) 

几乎 每 个 操作 系统 都 会 提供 一 些小 工具 ,system() 函 数 用 于 使 用 这 些小 工具 : 
>>> os.system("calc") # calc 是 Windows 系统 自 囊 的 计算 器 

回 车 后 即 弹出 计算 大 ,效果 如 图 8-3 所 示 。 


z 计算 器 - O ES 
得 看 (V) (E) 帮助 {H) 


0 


(om Ome Ome || me Dm Ds e [n] 
eee 
mmmmmEmimp9 
ema em [ee ee Le C 
le 
Pri NEN NES 


图 8-3 system O eR 


9. walk(top) 


最 后 是 walk O PR ZI. XA R RE A E E fof 3: 3E 0678. JH ELA AS TR AR AGREE, VALER 
的 作用 是 遍历 top 参数 指定 路 径 下 的 所 有 子 目录 ,并 将 结果 返回 一 个 三 元 组 (路 径 ,[ 包 含 目 
录 ],[ 包 含 文件 ]) 。 来 看 下 面 的 例子 : 


>>> for i in os. walk("test"): 
print(i) 

("test', ['a', 'b', 'c'], [1) 

('testWa', [], ['a.txt']) 

('test\\b', ['b1', 'b2'], ['b.txt']) 

('test\\b\\b1', [], ['b1.txt']) 
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('test\\b\\b2', [], ['b2.txt']) 
('testWc', ['c1'], [1) 
('test\\c\\c1', ['c11'], []) 
('test\\c\\c1\\c11', [], ['e11.txt']) 


为 了 便于 理解 ,我 画 个 实际 的 文件 夹 分 布 图 给 大 家 对 比 一 下 ,如 图 8-4 所 示 。 


TCI GEN Dn Gm 
Ee E 


图 8-4  walkO K% 


另外 path 模块 还 提供 了 一 些 很 实用 的 定义 ,分 别 是 : os. curdir 表示 当前 目录 ; os. pardir 
表示 上 一 级 目录 ('…. 05 os. sep 表示 路 径 的 分 隔 符 ,比如 Windows 系统 下 为 人 \\ ,Linux 下 为 
'/'3 os. linesep "PL ILICE Windows F J'NrNn'. Linux F X '\n’); 
os. name 表示 当前 使 用 的 操作 系统 。 

男 一 个 强大 的 模块 是 os. path, 它 可 以 完成 一 些 针 对 路 径 名 的 操作 。 表 8-4 列举 了 os. path 
中 稼 用 到 的 郴 数 使 用 方法 。 


表 8-4 os. path 模块 中 关于 路 径 常用 的 函数 使 用 方法 


EH 名 使 用 方法 
basename( path) 去 掉 目 录 路 径 ,单独 返回 文件 名 
dirname( path) 去 掉 文 件 名 ,单独 返回 目录 路 径 


joinCpathl[ ,path2[ , ... ] | 将 pathl 和 path2 各 部 分 组 合成 一 个 路 径 名 
分 割 文 件 名 与 路 径 ,返回 (f_path,，f_name) 元 组 。 如 果 完 全 使 用 目录 , 它 也 会 将 


最 后 一 个 目录 作为 文件 名 分 离 , 且 不 会 判断 文件 或 者 目录 是 否 存在 


splitext(path) 分 离 文件 名 与 扩展 名 ,返回 (f_name,f_extension) 元 组 
getsize(file) 返回 指定 文件 的 尺寸 ,单位 是 字 节 

, , 返回 指定 文件 最 近 的 访问 时 间 ( 浮 点 型 秒 数 , 可 用 time 模块 的 gmtime O 3X 
genauen localtime O 函数 换算 ) 

返回 指定 文件 的 创建 时 间 ( 浮 点 型 秒 数 ,可 用 time 模块 的 gmtimeO 2X, localtime( ) 
getctime( file) 

函数 换算 ) 

| . 返回 指定 文件 最 新 的 修改 时 间 ( 浮 点 型 秒 数 , 可 用 time 模块 的 gmtime() 或 
getmtime( file) localtimeO 函数 换算 ) 
以 下 为 函数 返回 True 或 False 
exists( path) 判断 指定 路 径 ( 目 录 或 文件 ) 是 否 存在 
isabs( path) 判断 指定 路 径 是 否 为 绝对 路 径 
isdir( path) 判断 指定 路 径 是 否 存在 且 是 一 个 目录 
isfileCpath) 判断 指定 路 径 是 否 存 在 且 是 一 个 文件 
islink( path) 判断 指定 路 径 是 否 存在 且 是 一 个 符号 链接 
ismount( path) 判断 指定 路 径 是 否 存在 且 是 一 个 挂 载 点 


samefileCpathl. path2) 判断 pathl 和 path2 两 个 路 径 是 否 指 回 同一 个 文件 
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10. basename(Cpath) 和 dirname( path) 
basename) fll dirname O PK ZI 431] FH] T 3453 OC 4T 4 B E : 


>>> os. path. dirname(r"a\b\test. txt") 
'a\\b' 

>>> os. path. basename(r"a\b\text. txt") 
'text. txt' 


11. joinCpath1| ,path2| ....] D 


join O 函数 跟 BIF 的 那个 join O 函数 不 同 ,os. path. join() 是 用 于 将 路 径 名 和 文件 名 组 合 
成 一 个 完整 的 路 径 : 


>>> os. path. join(r"C:VPython3AMTest", "FishC. txt") 
'C:\\Python34\\Test\\FishC. txt' 


12. split(path) 和 splitext( path) 


split() 和 splitext() 函 数 都 用 于 分 割 路 径 ,splitO 〇 函数 分 割 路 径 和 文件 名 (如 果 完 全 使 用 
目录 , 它 也 会 将 最 后 一 个 目录 作为 文件 名 分 离 ,有 旦 不 会 判断 文件 或 者 目录 是 否 存 在 ); splitext() 
图 数 则 是 用 于 分 割 文件 名 和 扩展 名 : 


>>> os. path. split(r"a\b\test. txt") 
('a\\b', 'test. txt') 

>>> os. path. splitext(r"a\b\test. txt") 
('a\\b\\test', '.txt') 


13. getsize( file) 


getsize() 图 数 用 于 获取 文件 的 尺寸 ,返回 值 是 以 字 节 为 单位 : 


>>> os. chdir(r"C:\Python34") 
>>> os. path. getsize("python. exe") 
40960 


14. getatimec( file) ,getctime(file) 3H getmtimec file) 


getatimeO ,getctimeO fll getmtime() 分 别 用 于 获得 文件 的 最 近 访 问 时 间 、 创 建 时 间 和 修 
改 时 间 。 不 过 返回 值 是 浮 点 型 秒 数 ,可 用 time 模块 的 gmtime() 或 localtimeO PA Zi 16:55. : 


>>> import time 

>>> temp = time. localtime(os.path. getatime("python. exe") ) 

>>> print("python. exe 被 访问 的 时 间 是 : ", time. strftime("%d %b %Y %H:%M: %S", temp)) 
python. exe 被 访问 的 时 间 是 : 27 May 2015 21:16:59 

>>> temp = time. localtime(os. path. getctime( "python. exe")) 

>>> print("python. exe 被 创建 的 时 间 是 : ", time.strftime(" $&d &b %Y €$H: SM: SS", temp)) 
python. exe 被 创建 的 时 间 是 : 24 Feb 2015 22:44:44 

>>> temp = time. localtime(os.path. getmtime("python. exe") ) 

>>> print("python. exe 被 修改 的 时 间 是 : ", time. strftime("%d %b %Y €H: £M: $S", temp)) 
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python. exe 被 修改 的 时 间 是 : 24 Feb 2015 22:44:44 
还 有 一 些 函 数 返 回 布尔 类 型 的 值 ,具体 的 解释 见 表 8-4, 这 里 就 不 一 一 举例 了 。 


8.3 pickle: Bel — &r SERE IU ;E 


M. —^r Xr HUBEBUE TES E A fae 4H 2 AR AB SEE E HB RUE , 那 就 需要 多 费 ， "mers $ 

为 无 论 是 read() 方 法 ,还 是 readline() 方 法 ,都 是 返回 一 个 字符 串 , 如 果 和 希望 从 字符 串 里 边 提 

取出 数值 的 话 , 可 以 使 用 int() 函 数 或 float() 函 数 把 类 似 '123' 或 '3.14' 这 类 字符 串 强 制 转换 为 
具体 的 数值 。 

此 前 一 直 在 讲 保 存 文本 ,然而 当 要 保存 的 数据 像 列 表 、 字 典 甚至 是 类 的 实例 这 些 更 复杂 的 
数据 类 型 时 ,普通 的 文件 操作 就 会 变 得 不 知 所 措 。 也 许 你 会 把 这 些 都 转换 为 字符 串 ,再 写 人 到 

一 个 文本 文件 中 保存 起 来 ,但 是 很 快 你 就 会 发 现 要 把 这 个 过 程 反 过 来 ,从 文本 文件 恢复 数据 对 
象 LAE TS rS RA T, 

HERJE Python 提供 了 一 个 标准 模块 ,使 用 这 个 模块 ,就 可 以 非常 容易 地 将 列表 、 字 典 
这 类 复杂 数据 类 型 存储 为 文件 了 。 这 个 模块 就 是 本 节 要 介绍 的 pickle 模块 。 

pickle 就 是 泡 全 , 腌 全 的 意思 ,相信 很 多 女 读者 都 对 恩 国 泡菜 尤其 情 有 独 钟 。 至 于 
Python 的 作者 为 何 把 这 么 一 个 高 大 Viros qi 我 想 应 该 是 跟 韩 剧 脱 不 了 干系 。 

好 ,说 回 这 个 泡菜 。 用 官方 文档 中 的 话说 ,这 是 一 个 令 人 惊叹 (amazing) 的 模块 , 它 几 乎 可 
以 把 所 有 Python ee pickling, 那 么 从 二 进 制 
形式 转换 回 对 象 的 过 程 称 为 unpickling。 

说 了 这 么 多 ,还 是 来 点 干货 吧 : 


# p8 3.py 
import pickle 


my list = [123, 3.14, HH f&', ['another list']] 

pickle file = open('E:Wmy list.pkl', 'wb') 

pickle.dump(my list, pickle file) 

pickle file.close() 

分 析 一 下 : 这 里 希望 把 这 个 列表 永久 保存 起 来 (保存 成 文件 ) ,打开 的 文件 一 定 要 以 二 进 
制 的 形式 打开 ,后 级 名 倒是 可 以 随意 ,不 过 既然 是 使 用 pickle 保存 ,为 了 今后 容易 记忆 ,建议 还 
是 使 用 . pkl 或 . pickle。 使 用 dump 方法 来 保存 数据 ,完成 后 记得 保存 , 跟 操作 普通 文本 文件 
一 样 。 

程序 执行 之 后 王 盘 会 出 现 一 个 my_list. pkl 的 文件 ,用 记事 本 打开 之 后 显示 乱码 (因为 它 
保存 的 是 二 进 制 形 式 ) ,如 图 8-5 所 示 。 

那么 在 使 用 的 时 候 只 需 用 二 进 制 模式 先 把 文件 打开 ,然后 用 load 把 数据 加 载 进来 : 


* p8 4.py 
import pickle 


pickle file = open("E:\\my_list. pkl", "rb") 
my list = pickle.load(pickle file) 


print(my list) 
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3l my. list.pkl - 记事 本 - O ES 
文件 (F) 编辑 (E) 格式 (D) 查看 (V) 帮助 (H) 
€ tq (K{G@ AEX mikak lX another listq'ae. ^ 


8-5 保存 为 pickle 文件 
程序 执行 后 又 取 回 我 们 的 列表 啦 : 


>>> 


[123, 3.14, '/H f&', ['another list']] 
>>> 


利用 pickle 模块 ,不仅 可 以 保存 列表 ,事实 上 pickle 可 以 保存 任何 你 能 想象 得 到 的 东西 。 
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9.1 你 不 可 能 总 是 对 的 


因为 我 们 是 人 ,不 是 神 , 所 以 我 们 经 常会 犯错 。 当 然 程 订 员 也 不 例外 ,就 算是 经 验 丰 蚜 的 
码 农 ,也 不 能 保证 写 出 来 的 代码 百分之百 没有 任何 问题 (要 不 哪 来 那么 多 0Day iii. 235. 
作为 一 个 合格 的 程序 员 ,在 编程 的 时 候 一 定 要 意识 到 一 点 ,就 是 永远 不 要 相信 你 的 用 户 。 要 把 
他 们 想象 成 能 孩子 ,把 他 们 想象 成 黑客 ,这 样 你 写 出 来 的 程序 目 然 会 更 加 安全 和 稳定 。 

那么 既然 程序 总 会 出 问题 ,我 们 就 应 该 学 会 用 适当 的 方法 去 解决 问题 。 程 序 出 现 逻 辑 错 
误 或 者 用 户 输入 不 合法 都 会 引发 异常 ,但 这 些 异常 并 不 是 致命 的 ,不 会 叶 致 程序 朋 演 死 掉 。 可 
以 利用 Python 提供 的 异常 处 理 机 制 , 在 异常 出 现 的 时 候 及 时 捕获 ,并 从 内 部 自我 消化 掉 。 

那么 什么 是 异常 呢 ?” 举 个 例子 : 

# p9_1.py 

file name = input(' 请 输入 要 打开 的 文件 名 :') 


f = open(file name, 'r') 


print( ' 文 件 的 内 容 是 : ') 


for each line in f: 
print(each line) 


这 里 当然 假设 用 户 的 输入 是 正确 的 ,但 只 要 用 户 输 入 一 个 不 存在 的 文件 名 ,那么 上 面 的 代 
>>> 
请 输入 要 打开 的 文件 名 : 我 为 什么 是 一 个 文档 .txt 
Traceback (most recent call last): 
File "E:\p9_1. py", line 2, in «module» 
f = open(file name, 'r') 
FileNotFoundError: [Errno 2] No such file or directory: ' 我 为 什么 是 一 个 文档 .txt' 
上 面 的 例子 就 抛 出 了 一 个 FileNotFoundError 异常 , 那 Python 通常 还 可 能 抛 出 哪些 异常 
呢 ? 这 里 给 大 家 做 个 总 结 , 今 后 遇 到 这 样 的 异常 时 就 不 会 感觉 到 了 生 了 了 。 


1. AssertionError: 断言 语句 (assert) 失败 


大 家 还 记得 断言 语句 吧 ? 在 关于 分 支 和 循环 的 章节 里 讲 过 。 当 assert 这 个 关键 字 后 边 的 
条 件 为 假 的 时 候 , 程 序 将 停止 并 抛 出 AssertionError 异常 。assert 语句 一 般 是 在 测试 程序 的 
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时 候 用 于 在 代码 中 置信 检查 点 : 


>>> my list = [" 小 甲鱼 "] 

>>> assert len(my list)>0 

>>> my list.pop() 

"小 甲鱼， 

>>> assert len(my list)>0 

Traceback (most recent call last): 

File "<pyshell#3>", line 1, in «module» 

assert len(my list) » 0 

AssertionError 


2. AttributeError: 尝试 访问 未 知 的 对 象 属性 
当 试 图 访问 的 对 象 属性 不 存在 时 抛 出 的 异常 : 


>>> my list = [] 
>>> my list.fishc 
Traceback (most recent call last): 
File "< pyshell£ 5>", line 1, in «module» 
my list.fishc 
AttributeError: 'list'object has no attribute 'fishc' 


3. IndexError: 索引 超出 序列 的 范围 
在 使 用 序列 的 时 候 就 党 第 会 遇 到 IndexError 异常 ,原因 是 索引 超出 序列 范围 的 内 容 : 


>>> my list = [1, 2, 3] 
>>> my list[3] 
Traceback (most recent call last): 
File "< pyshelli7»", line 1, in «module» 
my list[3] 
IndexError: list index out of range 


4. KeyError. 字典 中 查找 一 个 不 存在 的 关键 字 


当 试 图 在 字典 中 查找 一 个 不 存在 的 关键 字 时 就 会 引发 KeyError 异常 ,因此 建议 使 用 
dict. get() 方 法 : 


>>> my dict = ("one":1, "two":2, "three":3} 
>>> my dict["one"] 
1 
>>> my dict["four"] 
Traceback (most recent call last): 
File "< pyshell# 10>", line 1, in < module» 
my dict["four"] 


KeyError: 'four' 


5. NameError: 尝试 访问 一 个 不 存在 的 变量 
当 尝 试 访问 一 个 不 存在 的 变量 时 ,Python 会 抛 出 NameError 异常 : 
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>>> fishc 
Traceback (most recent call last): 
File "«pyshell£11»", line 1, in < module» 
fishc 
NameError: name 'fishc' is not defined 


6. OSError: 操作 系统 产生 的 异常 


OSError 顾名思义 就 是 操作 系统 产生 的 异 稼 , 像 打 开 一 个 不 存在 的 文件 会 引发 
FileNotFoundError ,而 这 个 FileNotFoundError 就 是 OSError 的 子 类 。 例 子 上 面 已 经 演示 
过 ,这 里 就 不 再 重复 。 


7. SyntaxError: Python 的 语法 错误 


如 果 遇 到 SyntaxError 是 Python 的 语法 错误 ,这 时 Python 的 代码 并 不 能 继续 执行 ,你 应 
该 先 找到 并 改正 错误 : 


>>> print "I love fishc. com" 
SyntaxError: Missing parentheses in call to 'print' 


8. TypeError: 不 同类 型 间 的 无 效 操作 
有 些 类 型 不 同 是 不 能 相互 进行 计算 的 ,否则 会 抛 出 TypeError 57:76 : 


>>> 1 + "1" 
Traceback (most recent call last): 
File "<pyshell#15>", line 1, in <module> 
1 "1I" 
TypeError: unsupported operand type(s) for + : 'int'and 'str' 


9. ZeroDivisionError. 除数 为 零 


地 球 人 都 知道 除数 不 能 为 去 ,所 以 除 以 堆 就 会 引发 ZeroDivisionError 5% : 


>>>5/0 
Traceback (most recent call last): 
File "<pyshell#16>", line 1, in < module» 
5/0 

ZeroDivisionError: division by zero 

好 了 ,知道 程序 抛 出 异常 就 说 明 这 个 程序 有 问题 ,但 问题 并 不 致命 ,所 以 可 以 通过 捕获 这 
些 异 常 ,并 纠正 这 些 错误 就 行 。 那 应 该 如 何 捕 获 和 处 理 异 常 呢 ? 

异常 捕获 可 以 使 用 try 语句 来 实现 ,任何 出 现在 try 语句 范围 内 的 异常 都 会 被 及 时 捕获 
f|. try 语句 有 两 种 实现 形式 : 一 种 是 try-except, 男 一 种 是 try-finally。 


9. 2 try-except i& f 


try-except 语句 格式 如 下 : 


try: 
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检测 范围 


except Exception[as reason]: 


出 现 异常 (Exception) 后 的 处 理 代码 
try-except 语句 用 于 检测 和 人 处理 异 常 , 举 个 例子 来 说 明 这 一 切 是 如 何 工 作 的 ， 


# p9_2.py 

f = open( ' 我 为 什么 是 一 个 文档 .txt') 
print(f.read()) 

f.close() 


以 上 代码 在 “我 为 什么 是 一 个 文档 . txt” 这 个 文档 不 存在 的 时 候 ,Python 就 会 报错 说 文件 
不 存在 : 


>>> 
Traceback (most recent call last): 
File "E:\p9_2. py", line 1, in <module> 
f = open( ' 我 为 什么 是 一 个 文档 . txt') 
FileNotFoundError: [Errno 2] No such file or directory: ' 我 为 什么 是 一 个 文档 .txt' 


>>> 

显然 这 样 的 用 户 体 验 不 好 ,因此 可 以 这 么 修改 : 
# p9 3.py 

try: 


f = open( ' 我 为 什么 是 一 个 文档 . txt') 
print(f.read()) 
f.close() 

except OSError: 


print( 文件 打开 的 过 程 中 出 错 啦 T_T ') 
上 面 的 例子 由 于 使 用 了 大 家 习惯 的 语言 来 表述 错误 信息 ,用 户 体验 当然 会 好 很 多 : 


>>> 


文件 打开 的 过 程 中 出 错 啦 T_T 

>>> 

但 是 从 程序 员 的 角度 来 看 ,导致 OSError 异常 的 原因 有 很 多 (例如 FileExistsError, 
FileNotFoundError、PermissionError 等 等 ) ,所 以 可 能 会 更 在 意 错 误 的 具体 内 容 , 这 里 可 以 使 
用 as 把 具体 的 错误 信息 给 打印 出 来 : 


except OSError as reason: 


print( ' 文 件 出 错 啦 T Tn 错误 原因 是 : ' + str(reason)) 


9.2.1 针对 不 同 异常 设置 多 个 except 


一 个 try 语句 还 可 以 和 多 个 except 语句 搭配 ,分 别 对 感 兴 趣 的 异常 进行 检测 处 理 : 


* p9 4.py 
try: 
sum = 1 + '1' 
f = open( ' 我 是 一 个 不 存在 的 文档 .txt') 
print(f.read()) 
f.close() 
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except OSError as reason: 
print( "文件 出 错 啦 T Tn 错误 原因 是 : ' + str(reason)) 
except TypeError as reason: 


print( ' 类 型 出 错 啦 T Tin 错误 原因 是 : ' + str(reason)) 


9.2.2 对 多 个 异常 统一 处 理 
except 后 边 还 可 以 跟 多 个 异常 ,然后 对 这 些 异 和 常 进行 统一 的 处 理 : 


# p9 5.py 
try 
int( 'abc') 
sum = 1 + '1' 
f = open( ' 我 是 一 个 不 存在 的 文档 .txt') 
print(f.read()) 
f.close() 
except (OSError, TypeError): 
print( ' 出 错 啦 T TWn 错误 原因 是 : ' + str(reason)) 


9.2.3 捕获 所 有 异常 


如 有 果 你 无 法 确定 要 对 哪 一 类 异常 进行 处 理 ,只 是 希望 在 try 语句 块 里 一 旦 出 现任 何 异 常 ， 
可 以 给 用 户 一 个 “看 得 懂 ” 的 提醒 ,那么 可 以 这 么 做 : 


except: 


print( ih f hi — ') 


不 过 通常 不 建议 你 这 么 做 ,因为 它 会 隐藏 所 有 程序 员 未 想到 并 且 未 做 好 处 理 准 备 的 错误 ， 
例如 当 用 户 输入 Ctrl 十 C 试图 终止 程序 , 却 被 解释 为 KeyboardInterrupt 异常 。 男 外 要 注意 的 
是 ,try 语句 检测 范围 内 一 旦 出 现 异 常 , 剩 下 的 语句 将 不 会 被 执行 。 


- | 1 五 
@.3 try-finally 语句 


如 果 “ 我 是 一 个 不 存在 的 文档 ”确实 存在 ,open() 函 数 正常 返回 文件 对 象 ,但 异常 却 发 生 
在 成 功 打开 文件 后 的 sum — 1 十 '1' 语 名 上 。 此 时 Python 将 直接 跳 到 except 语句 ,也 就 是 
说 ,文件 打开 了 ,但 并 没有 执行 关闭 文件 的 命令 : 


# p9 6.py 
try: 
f = open( ' 我 是 一 个 不 存在 的 文档 .txt') 
print(f.read()) 
sum = 1 + '' 
f.close() 
except: 


print( ' 出 错 啦 ') 
为 了 实现 像 这 种 “就 算出 现 异常 ,但 也 不 得 不 执行 的 收尾 工作 (比如 在 程序 有 骨 当前 保存 用 
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户 文 档 )”, 引 入 了 finally 来 扩展 try: 


# p9 7.py 
try: 
f = open( ' 我 是 一 个 不 存在 的 文档 . txt ') 
print(f.read()) 
sum = 1 + '1' 
except: 
print( ' 出 错 啦 ') 
finally: 
f.close() 
如 果 try 语句 块 中 没有 出 现任 何 运 行 时 错误 ,会 跳 过 except 语句 块 执行 fnally 语句 块 的 
VE. p IH A Lu CAT except 语句 块 的 内 容 再 执行 finally 语句 块 的 内 容 。 总 之 ， 
finally 语句 块 中 的 内 容 就 是 确保 无 论 如 何 都 将 被 执行 的 内 容 。 


9.4 raise 语 铝 


有 读者 可 能 会 问 ,我 的 代码 能 不 能 自己 抛 出 一 个 异常 呢 ? 管 案 是 可 以 的 ,你 可 以 使 用 
raise 语句 抛 出 一 个 异常 : 
>>> raise ZeroDivisionError 
Traceback (most recent call last): 
File "<pyshell#0>", line 1, in <module> 


raise ZeroDivisionError 
ZeroDivisionError 


34 ihi BS SE e n] EA ER, Ros SE A D CRI : 


>>> raise ZeroDivisionError(" 除 数 不 能 为 零 !") 
Traceback (most recent call last): 
File "< pyshell£z2»", line 1, in «module» 
raise ZeroDivisionError(" 除 数 不 能 为 零 !") 
ZeroDivisionError: 除数 不 能 为 零 ! 


9.5 丰富 的 else 语句 


有 读者 可 能 会 说 ,else 语句 还 有 啥 好 讲 的 ? £608 PR if 语句 进行 搭配 用 于 条 件 判 断 嘛 。 没 
错 , 对 于 大 多 数 编程 语言 来 说 ,else 语句 都 只 能 跟 i£ 语句 搭配 。 但 在 Python 里 ,else 语句 的 功 
能 更 加 丰富 。 

在 Python 中 ,else 语句 不 仅 能 跟 if 语句 搭 , 构 成 “要 么 怎样 ,要 么 不 怎样 ”的 句 式 ; 它 还 能 
跟 循环 语句 (for 语句 或 者 while 语句 ) ,构成 “ 干 完 了 能 怎样 , 干 不 完 就 别 想 怎 样 ” 的 句 式 ; 其 
实 else 语句 还 能 够 跟 刚 刚 讲 的 异常 处 理 进行 搭配 ,构成 “没有 问题 ? 那 就 干 吧 ” 的 句 式 , 下 边 
逐个 给 大 家 解释 。 


1. 要 么 怎样 ,要 么 不 怎样 


典型 的 if-else 搭配 : 


。 O8 。 


第 纺 章 “异常 处 理 |P 


if 条 件 : 
条 件 为 真 执行 
else: 


条 件 为 假 执行 


2. 干 完 了 能 怎样 , 干 不 完 就 别 想 怎样 


else 可 以 跟 for 和 while 循环 语句 配合 使 用 ,但 else 语句 块 只 在 循环 完成 后 执行 ,也 就 是 
说 ,如 果 循 环 中 间 使 用 break 语句 跳出 循环 ,那么 else 里 边 的 内 容 就 不 会 被 执行 了 。 举 个 
例子 : 

# p9 8.py 

def showMaxFactor( num) : 


count = num // 2 
while count » 1: 


if num % count == O0: 
print('%d 最 大 的 约 数 是 gd' % (num, count)) 
break 
count -= 1 
else: 


print('%d 是 素数 !' % num) 


num = int(input( "请 输入 一 个 数 : ')) 

showMaxFactor( num) 

X 4 /] ££ FF EZ RES. HJ i A A R d C 2^] 2C s S Js R R i LL RE D E jx 4 — 1 3 
数 ”。 注 意 要 使 用 地 板 除法 (count = num // 2) 哦 ,否则 结果 会 出 错 。 使 用 暴力 的 方法 一 个 个 
尝试 (num % count == 0) ,如 果 符 合 条 件 则 打印 出 最 大 的 约 数 ,并 break ,同时 不 会 执行 else 
语句 块 的 内 容 了。 但 如 果 一 直 没 有 遇 到 合适 的 条 件 , 则 会 执行 else 语句 块 内 容 。 

for 语句 的 用 法 跟 while 一 样 ,这 里 就 不 重复 举例 了 。 


3. 没有 问题 ? 那 就 干 吧 


else 语句 还 能 跟 刚 刚 学 的 异常 处 理 进行 搭配 ,实现 跟 与 循环 语句 搭配 差不多 : 只 要 try i 
句 块 里 没有 出 现任 何 异 常 ,那么 就 会 执行 else 语句 块 里 的 内 容 啦 。 举 个 例子 : 


# p9 9.py 
try: 
int('abc') 
except ValueError as reason: 
print( ' 出 错 啦 : ' + str(reason)) 
else: 


print( ' 没 有 任何 异常 ! ') 


0.6 简洁 的 with 语句 


有 读者 可 能 觉 大 打开 文件 又 要 关闭 文件 ,还 要 关注 异常 处 理 有 点 烦人 ,所 以 Python 提供 
了 一 个 with 语句 ,利用 这 个 语句 抽象 出 文件 操作 中 频 莹 使 用 的 try/except/finally 相关 的 细 
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着 。 对 文件 操作 使 用 with 语句 ,将 大 大 减少 代码 量 , 而 且 你 再 也 不 用 担心 出 现 文件 打开 了 忘 
记 关 闭 的 问题 了 (with 会 目 动 帮 你 关闭 文件 )。 举 个 例子 : 


# p9 10.py 
try: 

f = open('data.txt', 'w') 

for each line in f: 

print(each line) 

except OSError as reason: 

print( ' 出 错 啦 : ' + str(reason)) 
finally: 

f.close() 


使 用 with 语句 ,可 以 改 成 这 样 : 


# p9_11. py 
try: 
with open('data.txt', 'w') as f: 
for each line in f: 
print(each line) 
except OSError as reason: 
print(' 出 错 啦 : ' + str(reason)) 


是 不 是 很 方便 呢 ? 有 了 with 语句 ,就 再 也 不 用 担心 忘记 关闭 文件 了 。 
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图 形 用 户 界 面 入 门 


本 草 给 大 家 介绍 图 形 用 户 界 面 编程 ,也 就 是 平时 第 说 的 GUICGraphical User Interface, 
WefELgu:i DZife ,那些 囊 有 按钮 文本、 输入 框 的 窗口 的 编程 ,相信 大 家 都 不 会 陌生 。 

目前 有 很 多 Python 的 GUI T. H. & u[ [IE iE f£ , Python 44 — Tr dE 26 fj Ij GUI 工具 包 : 
EasyGui, EasyGui IR Č If] 44 ^£ — FE H . — HR BEBE SEA. EasyGui. GUI 操作 就 是 一 个 简 
单 地 调用 EasyGui KAJLA% A In] E r ri 

EasyGui 官网 : http://easygui. sourceforge. net, 

本 书 配 套 资源 : easygui-0. 96. zip. 

使 用 标准 方法 安装 

。 解压 easygui-0. 96. zip, 

。 使 用 命令 窗口 切换 到 easygui-docs-0. 96 的 目录 下 。 
在 Windows 下 执行 C:\Python34\python. exe setup. py install, 


* 在 Linux 或 Mac 下 执行 sudo /usr/bin/python34 setup. py install, 
Windows 下 的 安装 界面 如 图 10-1 所 示 。 


C:\windows\system32\cmd.exe 一 


(c) 2013 Microsoft Corporation。 人 保留 所 有 权利 。 
:\Users\ 佳 字 >cd C:NPython34Neasuygui-0.96 


:\Python34\easygui-0.96>C:\Python34\python.exe setup.py install 
i install 
build 
build_py 
install_lib 
install, egg. info 
Removing C:XPuython3"INLibXsite-packagesVeasugui-0.96-pu3..egg- info 


riting C: XPyEhon3uVLibXsite-packagesXessugui -8 .96-pu3. 4 .egg- info 


: MPython3'IVeasygui-0.96» 


图 10-1 EasyGui 的 安装 
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希望 深入 学 习 Python 的 读者 ,可 以 在 本 书 配 套 资源 中 的 easygui-0. 96. zip 压缩 包 中 找到 


EasyGui 各 个 困 数 的 实现 源 代 码 ( 下 载 地 址 http://bbs. fishc. com/thread-46069-1-1. html). 


附件 : easygui-0. 96. zip. 


40. 1 导入 EasyGui 
v 


为 了 使 用 EasyGui 这 个 模块 ,你 应 该 先导 入 它 。 最 简单 的 导入 语句 是 import easygui。 
如 果 使 用 这 种 形式 导入 的 话 , 那 么 在 使 用 EasyGui 的 函数 的 时 候 , 必 须 在 函数 的 前 面 加 


上 前 级 easygui: 


>>> import easygui 


>>> easygui. msgbox(" 吵 ,大 家 好 一 ") 
回 车 后 即 弹出 消息 框 ,如 图 10-2 所 示 。 P BE] x 
男 一 种 选择 是 叶 入 整个 EasyGui 包 : from easygui 

import. x ,这 样 使 得 我 们 更 容易 调用 EasyGui fi] ER aiai 

数 , 可 以 直接 这 样 编写 代码 : OK | 


>>> from easygui import * 
>>> msgbox(" 嗨 ,小 美女 一 ") 图 10-2 导入 EasyGui 模块 (方法 一 ) 


回 车 后 即 弹 出 消息 框 ,如 图 10-3 所 示 。 
第 三 种 方案 是 使 用 类 似 下 边 的 import 语句 (建议 使 用 ) : import easygui as g, 这 样 可 以 让 


你 保持 EasyGui 的 命名 空间 ,同时 减少 输入 字符 的 数量 . 
>>> import easygui as g 
>>> g.msgbox(" i$, f&á c~") 
回 车 后 即 弹出 消息 框 ,如 图 10-4 所 示 。 
a x / -oNAM 


d 
gg, f&c- 


路 ,小 美女 ~ 
OK | OK | 


图 10-3 导入 EasyGui 模块 (方法 二 ) 10-4 导入 EasyGui 模块 (方法 三 ) 


40.2 使 用 EasyGui 
A 


A n 4- inj "n 的 例 T - 
# p10_1. py 

import easygui as g 
import sys 


while 1: 
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g. msgbox(" 嗨 ,欢迎 进入 第 一 个 界面 小 游戏 ^~_“") 
msg = "请 问 你 希望 在 鱼 C 工作 室 学 习 到 什么 知识 呢 ?" 
title = "小 游戏 互动 " 
choices = [" 谈 恋爱 ", "E", "demo", "Zp H" ] 
choice = g.choicebox(msg, title, choices) 
i note that we convert choice to string, in case 
# the user cancelled the choice, and we got None. 
g.msgbox(" 你 的 选择 是 : ”+ str(choice)," 结 果 ") 
msg = "你 希望 重新 开始 小 游戏 吗 ?" 
title = "请 选择 " 
if g.ccbox(msg, title): # show a Continue/Cancel dialog 
pass # user chose Continue 
else: 
sys.exit(0) # user chose Cancel 


实现 过 程 如 图 10-5 一 图 10-8 所 示 。 
í - ng 
86 , OBEAS — NREN ^ 


ri 


图 10-5 使 用 EasyGui 编写 第 一 个 界面 小 游戏 (一 ) 


d 小 游戏 互动 - o E 
OK | 
请 问 你 希望 在 鱼 C 工 作 室 学 习 到 什么 知识 呢 ? 
Cancel 
OOXX | 
ZSEBE 
T3 


图 10-6 使 用 EasyGui 编写 第 一 个 界面 小 游戏 (二 ) 


í 结果 -nNdE 
你 的 选择 足 : 编程 


OK | 
10-7 使 用 EasyGui 编写 第 一 个 界面 小 游戏 (三 ) 


í 请 选择 。 一 0 ES 
你 希望 重新 开始 小 游戏 吗 ? 


Continue | Cancel | 


图 10-8 ”使 用 EasyGui 编写 第 一 个 界面 小 游戏 (四 ) 
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40.3 ”修改 默认 设置 

wu» 
默认 情况 下 显示 的 对 话 框 非常 大 ,而 且 字 体 也 相对 难看 。 这 里 可 以 手动 调整 EsayGui 的 
修改 位 置 为 C:\Python34\Lib\site-packages\easygui. py. 

更 改 对 话 框 尺寸 : 找到 def choicebox. FH ÉJ root. width = int((screen width * 
0.8)) 和 root height = int((screen_height * 0.5)) 分 别 改 为 root. width = int((screen_ 
width * 0.4)) 和 root height = int((screen height * 0.25))。 

更 改 字 体 : 找到 PROPORTIONAL FONT FAMILY = ("MS", "Sans", "Serif") lp Jy 
PROPORTIONAL FONT FAMILY = 二 ("微软 雅 黑 ")。 

EasyGui 提供 了 非常 多 的 组 件 供 我 们 实现 一 个 完整 的 界面 程序 ,刚才 给 大 家 演示 的 就 是 
msgbox、choicebox 和 ccbox 的 用 法 。 关 于 更 多 的 组 件 使 用 ,大 家 可 以 参考 小 甲鱼 翻译 改编 的 
《EasyGui 学 习 文 档 》: http://bbs. fishc. com/thread-46069-1-1. html, 
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(11.1 给 大 家 介绍 对 象 


什么 会 跑 , 但 作为 赛车 手 , 这 些 原理 就 必须 要 民 , 因 为 这 有 助 于 他 把 车 开 得 更 好 。 因 此 ,本 草 就 
问 大 家 隆重 地 介绍 对 象 ! 

大 家 之 前 已 经 听 说 过 封装 的 概念 ,把 乱七八糟 的 数据 扔 进 列 表 里 边 ,这 是 一 种 封装 ,是 数 
据 层面 的 封装 ; 把 常用 的 代码 段 打 包 成 一 个 函数 ,这 也 是 一 种 封装 ,是 语句 层面 的 封装 ; 本 章 
学 习 的 对 象 , 也 是 一 种 封装 的 思想 ,不 过 这 种 思想 显然 要 更 先进 一 步 : 对 象 的 来 源 是 模拟 真实 
世界 ,把 数据 和 代码 都 封装 在 了 一 起 。 

打 个 比方 , 马 龟 就 是 真实 世界 的 一 个 对 象 ,那么 通 第 应 该 如 何 来 描述 这 个 对 象 呢 ? 是 不 是 
把 它 分 为 两 部 分 来 说 ? 

(1) 可 以 从 静态 的 特征 来 描述 ,例如 ,绿色 的 、 有 四 条 腿 ,10kg 重 , 有 外 壳 , 还 有 个 大 嘴巴 ， 
这 是 静态 一 方面 的 描述 。 

(2) 还 可 以 从 动态 的 行为 来 描述 ,例如 说 它 会 候 , 你 如 果 追 它 , 它 就 会 跑 , 然 后 你 把 它 双 急 
了 , 它 就 会 咬 人 ,被 它 咬 到 了 ,据说 要 打雷 才 会 松 开 嘴巴 …… 它 的 嘴巴 的 重要 作用 不 是 用 来 咬 
人 ,是 用 来 吃 东西 的 ,然后 它 还 会 睡觉 。 这 些 都 是 从 行为 方面 进行 描述 的 。 

那 如 果 把 一 个 人 作为 对 象 , 你 会 从 哪 两 方面 来 描述 这 个 人 ? 

对 嘛 ,无 非 就 是 他 长 什么 样 ? 这 是 从 外 观 方面 找 特征 ,例如 ,有 眼 焉 田子 斜 \ 胸 大 屁股 杰 , 这 
些 都 是 静态 的 特征 。 男 一 方面 就 是 描述 他 的 行为 ? 例如 ,唱歌 .街舞 、 打 篮球 等 等 。 


41.2 对象 = 属 性 + 方法 
Python 中 的 对 象 也 是 如 此 ,一 个 对 象 的 特征 称 为 "属性 ” ,一 个 对 象 的 行为 称 为 "方法 ”。 
如 果 把 “乌龟 "写成 代码 ,将 会 是 下 边 这 样 ; 
# pll 1.py 
class Turtle: 
# Python 中 的 类 名 约定 以 大 写字 母 开 头 
# 特征 的 描述 称 为 属性 ,在 代码 层面 来 看 其 实 就 是 变量 


color = 'green' 
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weight = 10 
legs = 4 
shell = True 
mouth = ' 大 嘴 ， 


# 方法 实际 就 是 函数 ,通过 调用 这 些 函 数 来 完成 某 些 工作 
def climb(self): 
print("J& iE TE 48 5 7] MLIS RUE") 
def run(self): 
print(" 我 正在 飞快 地 向 前 跑 …") 
def bite(self): 
print(" We JE ff Wz 5E JR 1") 
def eat(self): 
print(" 有 得 吃 , 真 满足 ”^") 
def sleep(self) : 
print(" 困 了 , 睡 了 ,晚安 ,Zzzz") 
以 上 代码 定义 了 对 象 的 特征 (属性 ) 和 行为 (方法 ) ,但 还 不 是 一 个 完整 的 对 象 ,将 定义 的 这 
些 称 为 类 (Class) 。 需 要 使 用 类 来 创建 一 个 真正 的 对 象 , 这 个 对 象 就 叫 作 这 个 类 的 一 个 实例 
(Instance) ,也 叫 实 例 对 象 (Instance Objects), 
有 些 读者 可 能 还 不 大 理解 ,你 可 以 这 么 想 : 这 就 好 比 工 厂 的 流水 线 要 生产 一 系列 玩具 ,是 
不 是 要 先 做 出 这 个 玩具 的 模具 ,然后 根据 这 个 模具 再 进行 批量 生产 , 才 得 到 真正 的 玩具 ? 
再 举 个 例子 : 盖 房 子 , 是 不 是 先 要 有 个 图 纸 ,但 光 有 个 图 纸 你 能 不 能 住 进去 ? 显然 不 能 ， 
图 纸 只 能 告诉 你 这 个 房子 长 什么 样 ,但 图 纸 并 不 是 真正 的 房子 。 要 根据 图 纸 用 钢筋 水 泥 建 造 
出 来 的 房子 才能 住人 ,另外 根据 一 张 图 纸 就 能 盖 出 很 多 的 房子 。 
好 ,说 了 这 么 多 , 那 真正 的 实例 对 象 怎么 创建 ? 
创建 一 个 对 象 ,也 叫 类 的 实例 化 ,其 实 非常 简单 : 
>> # 先 运行 pl1_1.py 


>>> tt = Turtle() 
>>> 


注意 ,类 名 后 边 跟 着 的 小 括号 ,这 跟 调 用 困 数 是 一 样 的 ,所 以 在 Python 中 ,类 名 约定 用 大 
写字 母 开 头 , 困 数 用 小 写字 母 开 头 , 这 样 更 容易 区 分 。 另 外 赋值 操作 并 不 是 必需 的 ,但 如 果 没 
有 把 创建 好 的 实例 对 象 赋值 给 一 个 变量 , 那 这 个 对 象 就 没 办 法 使 用 ,因为 没有 任何 引用 指 问 这 
个 实例 ,最 终 会 被 Python 的 垃圾 收集 机 制 自动 回收 。 

那 如 果 要 调用 对 和 象 里 的 方法 ,使 用 点 操作 符 (. ) 即 可 ,其 实 我 们 已 经 用 了 何止 千 百 过 : 

>>> tt.climb() 

我 正在 很 努力 地 向 前 有 息 …… 

>>> tt.bite() 

咬 死 你 咬 死 你 !! 


>>> tt. sleep() 
困 了 , 睡 了 ,晚安 ,Zzzz 


11.3 面向 对 象 编程 


面 问 对 象 编程 很 厉害 ,但 不 知道 具体 怎么 用 ? 下 面 通过 几 个 主题 ,尝试 给 大 家 进一步 剖析 
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Python 的 类 和 对 象 。 


i191 —self EtA 


细心 的 读者 会 发 现 对 象 的 方法 都 会 有 一 个 self 参数 , 那 这 个 self 到 底 是 个 什么 东西 呢 ? 
如 末 此 前 接触 过 其 他 面 问 对 象 的 编程 语言 ,例如 C++ ,那么 你 应 该 很 容易 对 号 人 座 ,Python 的 
self 其 实 就 相当 于 C++ 的 chis 指针 。 

这 里 为 了 照顾 大 部 分 的 初学 编程 的 读者 ,讲解 下 self 到 底 是 个 什么 东西 。 如 果 把 类 比 作 
是 图 纸 ,那么 由 类 实例 化 后 的 对 象 才 是 真正 可 以 住 的 房子 。 根 据 一 张 图 纸 就 可 以 设计 出 成 千 
上 万 的 房子 ,它们 长 得 都 差不多 ,但 它们 都 有 不 同 的 主人 。 每 个 人 都 只 能 回 上 自己 的 家 里 ,陪伴 
自己 的 孩子 …… 所 以 self 这 里 就 相当 于 每 个 房子 的 门牌 号 ,有 了 self ,你 就 可 以 轻松 找到 目 己 
的 房子 。 

Python 的 self 参数 就 是 同一 个 道理 ,由 同一 个 类 可 以 生成 无 数 对 象 , 当 一 个 对 象 的 方法 
被 调用 的 时 候 , 对 象 会 将 日 号 的 引用 作为 第 一 个 参数 传 给 该 方法 ,那么 Python 就 知道 需要 操 
作 哪 个 对 象 的 方法 了 。 

通过 一 个 例子 稍微 感受 下 : 

>>> class Ball: 

def setName(self, name): 
self.name - name 


def kick(self): 
print( "我 叫 $ s, IR ~ WBR?!" % self. name) 


>>> a = Ball() 

>>> a. setName(" 飞 火 流星 ") 
>>> b = Ball() 

>>> b. setNane(" Hl [A Z7 E") 
»»» c = Ball() 

>>> c. setName( "4 9g") # 乱入 
>>> a.kick() 

3 n] € X yi E, — ER?! 
>>> b.kick() 

4x ni] pr] pA zz. E& , n — iE S d?! 
>>> c.kick() 

我 叫 土豆 , 噢 一 谁 踢 我 ?! 


11.3.2 你 听 说 过 Python 的 魔法 方法 吗 


据说 ,Python 的 对 象 天 生 拥 有 一 些 神 奇 的 方法 ,它们 是 面 回 对 象 的 Python 的 一 切 。 它 们 
是 可 以 给 你 的 类 增加 魔力 的 特殊 方法 ,如 果 你 的 对 象 实现 了 这 些 方 法 中 的 某 一 个 ,那么 这 个 方 
法 就 会 在 特殊 的 情况 下 被 Python 所 调用 ,而 这 一 切 都 是 自动 发 生 的 。 

Python 的 这 些 具有 魔力 的 方法 ,总 是 被 双 下 划 线 所 包围 ,今天 就 讲 其 中 一 个 最 基本 的 特 
殊 方 法 __init__O 〇 ,关于 其 他 Python 的 魔法 方法 , 接 下 来 会 专门 用 一 个 章节 来 详细 讲解 。 

通常 把 _init _O 〇 方法 称 为 构造 方法 ，_init _O 〇 方法 的 魔力 体现 在 只 要 实例 化 一 个 对 象 ， 
这 个 方法 就 会 在 对 象 被 创建 时 自动 调用 (在 C+t+ 里 你 也 可 以 看 到 类 似 的 东西 , 叫 “ 构 造 函 数 ”)， 
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其 实 ,实例 化 对 象 时 是 可 以 传人 参数 的 ,这 些 参数 会 目 动 传人 __init__() 方 法 中 ,可 以 通过 重 与 
这 个 方法 来 自 定 义 对 象 的 初始 化 操作 。 举 个 例子 : 


>>> class Potato: 
def — init (self, name): 
self.name - name 
def kick(self): 
print("FR IY % s, WR — WDR?!" % self. name) 


>>> p = Potato(" 土 豆 ") 
>>> p.kick() 
RU +E, ~ER?! 


11.3.3 公有 和 私有 


一 般 面 癌 对 象 的 编程 语言 都 会 区 分 公有 和 私有 的 数据 类 型 , 像 C++ 和 Java 它们 使 用 
public 和 private 关键 字 ,用 于 声明 数据 是 公有 的 还 是 私有 的 ,但 在 Python 中 并 没有 用 类 似 的 
关键 字 来 修饰 。 

难道 Python 所 有 东西 都 是 透明 的 ? 也 不 全 是 ,默认 上 对 象 的 属性 和 方法 都 是 公开 的 ,可 
以 直接 通过 点 操作 符 (. ) 进 行 访 问 : 


>>> class Person: 


name = "小 甲鱼 " 


>>> p = Person() 
>>> p.name 


小 甲鱼 


为 了 实现 类 似 私 有 变量 的 特征 ,Python 内 部 采用 了 一 种 叫 name mangling( 名 字 改 编 ) 的 
技术 ,在 Python 中 定义 私有 变量 只 需要 在 变量 名 或 函数 名 前 加 上 “__” 两 个 下 划 线 ,那么 这 个 
PK Zt aV, AE fit b zz LJ RO Y: 


>>> class Person: 


. name = "小 甲鱼 " 


>>> p = Person() 
>>> p. name 
Traceback (most recent call last): 
File "< pyshell # 32>", line 1, in «module» 
p. name 
AttributeError: 'Person'object has no attribute ' name' 


这 样 在 外 部 将 变量 名 "隐藏 "起 来 了 ,理论 上 如 果 要 访问 ,就 需要 从 内 部 进行 : 


>>> class Person: 
def init (self, name): 
self. name - name 
def getName( self): 


return self. name 
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>>> p = Person(" 小 甲鱼 ") 
>>> p. name 
Traceback (most recent call last): 

File "< pyshell # 40>", line 1, in < module» 

p. name 

AttributeError: 'Person'object has no attribute ' name' 
>>> p. getName( ) 
LE: 


但 是 你 认真 琢磨 一 下 这 个 技术 的 名 字 name mangling( 名 字 改 编 ), 那 就 不 难 发 现 其 实 
Python 只 是 动 了 一 下 手脚 ,把 双 下 横 线 开头 的 变量 进行 了 改名 而 已 。 实 际 上 在 外 部 你 使 用 
“类 名 变量 名 ” 即 可 访问 双 下 横 线 开头 的 私有 变量 了 : 


>>> p. Person name 


LIE 

(iE: Python 目前 的 私有 机 制 其 实 是 伪 私 有 ,Python 的 类 是 没有 权限 控制 的 ,所 有 变量 都 
是 可 以 被 外 部 调用 的 。 最 后 的 这 部 分 有 些 谈 者 (尤其 是 没有 接触 过 面 癌 对 象 编程 的 该 者 ) 可 能 
看 不 懂 , 想 不 明日 有 什么 用 ? 没事 , 先 放 痢 ,下 节 讲 完 继 承 机 制 你 就 会 窖 然 开 明了 。) 


41.4 继承 


现在 需要 扩展 族 戏 , 对 鱼 类 进行 细 分 ,有 金鱼 (Goldfish) .鲤鱼 (Carp) = X fi (Salmon), 
还 有 获 鱼 (Shark)。 那 么 我 们 就 再 思考 一 个 问题 : 能 不 能 不 要 每 次 都 从 头 到 尾 去 重新 定义 一 
个 新 的 鱼 类 呢 ? 因为 我 们 知道 大 部 分 鱼 的 属性 和 方法 是 相似 的 ,如 果 有 一 种 机 制 可 以 让 这 些 
相似 的 东西 得 以 自动 传递 , 那 就 方便 快捷 多 了 。 没 错 , 你 猜 到 了 ,这 种 机 制 就 是 今天 要 讲 的 : 
继承 。 

语法 很 简单 : 


class 类 名 (被 继承 的 类 ) : 


被 继承 的 类 称 为 基 类 、 父 类 或 超 类 ; 继承 者 称 为 子 类 ,一 个 子 类 可 以 继承 它 的 父 类 的 任何 
属性 和 方法 。 举 个 例子 : 


>>> class Parent: 
def hello(self): 
print(" 正 在 调用 父 类 的 方法 …") 


>>> class Child(Parent): 


pass 


>>> p = Parent() 

>>> p. hello() 
正在 调用 父 类 的 方法 … 
»»»c = Child() 

>>> c. hello() 


正在 调用 父 类 的 方法 … 
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需要 注意 的 是 ,如 采 子 类 中 定义 与 父 关 同名 的 方法 或 属性 , 则 会 目 动 履 兰 父 类 对 应 的 方法 
或 属性 : 


>>> Class Child(Parent) : 
def hello(self): 
print(" 正 在 调用 子 类 的 方法 …") 


»»» c = Child() 
>>> c. hello() 


正在 调用 子 类 的 方法 … 


好 , 那 尝 试 来 写 一 下 刚才 提 到 的 金 包 (Goldfish) .鲤鱼 (Carp) , = X fi (Salmon) 34H 5 fü 
(Shark) 的 例子 : 


# pll 2.py 
import random as r 


class Fish: 
def init (self): 
self.x = r.randint(0, 10) 
self.y = r.randint(0, 10) 


def move( self): 
# 这 里 主要 演示 类 的 继承 机 制 ,就 不 考虑 检查 场景 边界 和 移动 方向 的 问题 


* 假设 所 有 鱼 都 是 一 路 向 西游 


self.x -= 1 


print(" 我 的 位 置 是 : ", self.x, self. y) 


class Goldfish(Fish): 
pass 


class Carp(Fish): 
pass 


class Salmon(Fish): 
pass 


# 上 边 几 个 都 是 食物 ,食物 不 需要 有 个 性 ,所 以 直接 继承 Fish 类 的 全 部 属性 和 方法 即 可 
# 下 边 定 义 获 鱼 类 ,这 个 是 吃 货 ,除了 继承 Fish 类 的 属性 和 方法 ,还 要 添加 一 个 吃 的 方法 


class Shark(Fish): 
def init (self): 
self.hungry - True 
def eat(self): 
if self. hungry: 
print(" 吃 货 的 梦想 就 是 天 天 有 得 吃 ^_^") 
self. hungry = False 
else: 


print(" 太 撑 了 , 吃 不 下 !") 
>> # 先 运 行 pl1 -2.py 
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>>> fish = Fish() 

>> # 试 试 小 鱼 能 不 能 移动 
>>> fish.movel( ) 
我 的 位 置 是 : 5 10 

>>> goldfish = Goldfish() 
>>> goldfish.move() 
我 的 位 置 是 : 910 

>>> goldfish.move() 
我 的 位 置 是 : 8 10 

>>> goldfish.move() 

我 的 位 置 是 : 7 10 

>> # 可 见 金鱼 确实 在 一 路 向 西 … 
>> # 下 边 尝 试 生 成 阔 鱼 
>>> shark = Shark() 


>>> # 试 试 这 货 能 不 能 吃 东西 ? 
>>> shark. eat() 


吃 货 的 梦想 就 是 天 天 有 得 吃 ^_^ 
>>> shark. eat() 


太 撑 了 , 吃 不 下 ! 
>>> shark. move() 
Traceback (most recent call last): 
File "< pyshell# 16>", line 1, in < module» 
shark. move( ) 
File "E:Mp11 2.py", line 13, in move 
self.x -= 1 
AttributeError: 'Shark' object has no attribute 'x' 


奇怪 ! 同样 是 继承 于 Fish 26.99 fF 4A 4 f& (goldfish) nf A zJj . m Æ ta (shark) — £2 z) sik 
报错 呢 ? 

其 实 这 里 抛 出 的 异常 说 得 很 清楚 了 : Shark WARA x 属性。 原因 其 实 是 这 样 的 : 在 
Shark 类 中 , 重 写 了 魔法 方法 __init__, 但 新 的 __init 方法 里 边 没 有 初始 化 小 包 的 x 坐标 和 y 
坐标 ,因此 调用 move 方法 就 会 出 错 。 那 么 解决 这 个 问题 的 方案 就 很 明显 了 ,应 该 在 效 包 类 中 
3873 — init. 方法 的 时 候 先 调用 基 类 Fish 的 _init 方法 。 

下 面 介绍 两 种 可 以 实现 的 技术 : 

。 调用 未 绑 定 的 父 类 方法 。 

" 使 用 super PR ZA, 


11.4.1 调用 未 绑 定 的 父 类 方法 
调用 未 绑 定 的 父 类 方法 , 听 起 来 有 些 高 深 ,但 大 家 参考 下 面 改 写 的 代码 就 能 心领神会 了 : 


class Shark(Fish): 
def init (self): 
Fish. init (self) 
self. hungry = True 


髓 运行 下 发 现 效 鱼 也 可 以 成 功 移动 了 : 


>> # 先 运 行 修改 后 的 p11- 2. py 
>>> shark = Shark() 
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>>> shark. move( ) 
我 的 位 置 是 : 7 9 
>>> shark. move() 


我 的 位 置 是 : 6 9 


这 里 需要 注意 的 是 这 个 self 并 不 是 父 类 Fish 的 实例 对 象 ,而 是 子 类 Shark 的 实例 对 象 ， 
所 以 这 里 说 的 未 绑 定 是 指 并 不 需要 绑 定 父 类 的 实例 对 象 ,使 用 子 类 的 实例 对 象 代 奉 即 可 。 

有 些 读 者 可 能 不 大 理解 ,没关系 ,这 一 点 都 不 重要 ! 因为 在 Python 中 ,有 一 个 更 好 的 方 
案 可 以 取代 它 ,就 是 使 用 super KX. 


11.4.2 使 用 super 函数 


super 函数 能 够 帮 我 自动 找到 基 类 的 方法 ,而 且 还 为 我 们 传 入 了 self 参数 ,这 样 就 不 需要 
做 这 些 事情 了 : 
# 将 p11 一 2.py 闭 鱼 的 代码 作 如 下 修改 
class Shark(Fish): 
def init (self): 
super(). init () 


self. hungry = True 
运行 后 得 到 同样 的 结果 : 


>>> # 先 运 行 修改 后 的 p11- 2. py 
>>> shark = Shark() 
>>> shark. move() 


我 的 位 置 是 : 6 1 


>>> shark. move() 


我 的 位 置 是 : 5 1 


super 图 数 的 "超级 ?之 处 在 于 你 不 需要 明确 给 出 任何 基 类 的 名 字 , 它 会 和 目 动 帮 您 找 出 所 
有 基 类 以 及 对 应 的 方法 。 由 于 你 不 用 给 出 基 类 的 名 字 ,这 台 意 味 者 如 采 需 要 改变 类 继承 关系 ， 
只 要 改变 class 语句 里 的 父 类 即 可 ,而 不 必 在 大 量 代 码 中 去 修改 所 有 被 继承 的 方法 。 


41.5 多 重 继承 


除 此 之 外 Python 还 文 持 多 继承 ,就 是 可 以 同时 继承 多 个 父 类 的 属性 和 方法 : 
class 类 名 ( 父 类 1, 父 类 2, 父 类 3, … ) : 
>>> class Basel: 


def fool(self): 
print(" 我 是 fool, RE Basel 中 …") 


>>> class Base2: 


def foo2(self): 
print(" 我 是 foo2 ,我 在 Base2 中 …") 
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>>> class C(Basel, Base2): 


pass 


>>>c = C() 
>>> c.fool() 


我 是 fool, 我 在 Basel 中 … 


>>> c.foo2() 


我 是 foo2 ,我 在 Base2 中 … 

上 面 就 是 基本 的 多 重 继 承 语法 。 但 多 重 继 承 其 实 很 容易 导致 代码 混乱 ,所 以 当 你 不 确定 是 
否 真 的 必须 使 用 多 重 继 承 的 时 候 , 请 尽量 避免 使 用 它 , 因 为 有 些 时 候 会 出 现 不 可 预见 的 BUG. 

【扩展 阅读 了 多 重 继 承 的 陷阱 : 钻石 继承 (菱形 继承 ) 问 题 (http://bbs. fishc. com/thread- 
48759-1-1. html). 


11.6 组 合 


[n] fh EXE 
前 边 先是 学 习 了 继承 的 概念 ,然后 又 学 习 了 多 重 继承 ,但 听 到 大 牛 们 强调 说 不 到 必要 的 时 
修 不 使 用 多 重 继承 。 哄 呀 ,这 可 让 大 家 烦恼 死 了 ,就 像 上 回 我 们 有 了 乌龟 类 、 鱼 类 ,现在 要 求 定 
义 一 个 类 , 叫 水 池 ,水 池 里 要 有 乌 怨 和 鱼 。 用 多 重 继承 就 显得 很 奇怪 ,因为 水 池 和 马 怨 、 鱼 是 不 
同 物种 , 那 要 怎样 才能 把 它们 组 合成 一 个 水 池 的 类 呢 ? 
在 Python 里 其 实 很 位 单 ,直接 把 需要 的 类 放 进 去 实例 化 就 可 以 了 ,这 就 叫 组 合 : 


# pli 3.py 
class Turtle: 
def init (self, x): 


self.num = x 


class Fish: 
def init (self, x): 


self. num = x 


class Pool: 
def | init (self, x, y): 
self.turtle - Turtle(x) 
self.fish = Fish(y) 
def print num(self): 
print(" 水 池 里 总 共有 乌龟 sd 只 ,小 鱼 Sd ZR!" % (self.turtle.num, self.fish.num)) 
>>> # 先 运行 pl1l_3.py 
>>> pool = Pool(1, 10) 
>>> pool.print num() 


水 池 里 总 共有 乌龟 1 只 ,小 鱼 10 条 ! 


Python 的 特性 其 实 还 文 持 另外 一 种 很 流行 的 编程 模式 : Mixin, 有 兴趣 的 朋友 可 以 看 看 
【扩展 阅读 Mixin 编程 机 制 (http://bbs. fishc. com/thread-48888-1-1. html), 
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01.7 类 、 类 对 象 和 实例 对 象 


先 来 分 析 一 段 代 码 ，: 


>>> class C: 


count = 0 


>>>a = C() 
>>>b = C() 
>>>c = C() 
>>> print(a.count, b.count, c.count) 
000 

>>> c.count += 10 

>>> print(a.count, b.count, c.count) 
0 0 10 

>>> C.count += 100 

>>> print(a.count, b.count, c.count) 
100 100 10 


从 上 面 的 例子 可 以 看 出 ,对 实例 对 象 c 的 count 
属性 进行 赋值 后 ,就 相当 于 覆盖 了 类 对 象 C 的 类 定义 


count 属性 。 如 图 11-1 所 示 , AU A 2 A EL TRI ms 
那么 引用 的 是 类 对 象 的 count 属性 ， 类 对 入 ml 


需要 注意 的 是 ,类 中 定义 的 属性 是 静态 变量 ， 
也 就 是 相当 于 C 语言 中 加 上 staic 关键 字 声 明 的 AR EB EB 
变量 ,类 的 属性 是 与 类 对 和 象 进行 绑 定 ,并 不 会 依赖 
任何 它 的 实例 对 象 。 这 点 待 会 儿 继 续 讲解 。 

为 外 ,如 果 属 性 的 名 字 跟 方法 名 相同 ,属性 会 履 新 方法 : 


图 11-1 类 、 类 对 象 和 实例 对 象 


class C: 
def x(self): 
print( 'Xman') 


>>>c = C() 

>>> c.x() 

Xman 

>>> C.X = 1 

>>> C.X 

1 

>>> c.x() 

Traceback (most recent call last): 
File "< pyshelli 20>", line 1, in «module» 

c. x() 
TypeError: 'int'object is not callable 


Hy SERAF EIR , KRMA ST — 16 29 E (8L AUR : 
。 类 的 定义 要 “ 少 吃 多 餐 ”, 不 要 试图 在 一 个 类 里 边 定 义 出 所 有 能 想到 的 特性 和 方法 ,应 
该 利用 继承 和 组 合 机 制 来 进行 扩展 。 
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。 用 不 同 的 词性 命名 ,如 属性 名 用 名 词 .方法 名 用 动词 ,并 使 用 骆驼 命名 法 0 等 。 


41.8 到 底 什么 是 绑 定 


Python 严格 要 求 方法 需要 有 实例 才能 被 调用 ,这 种 限制 其 实 就 是 Python 所 谓 的 绑 定 概 
前 面 也 粗略 地 解释 了 一 下 绑 定 ,但 有 些 谈 者 可 能 会 这 么 和 尝试 ,然后 发 现 也 可 以 调用 : 


A 
mU 


o 


>>> class BB: 
def printBB(): 


print("no zuo no die") 


>>> BB. printBB() 


no zuo no die 
但 这 样 做 会 有 一 个 问题 C d i s AS SC DAE Jes OE RAR ZI 2613s 5] A E 322 A eR ZI : 


»»» bb - BB() 
>>> bb. printBB() 
Traceback (most recent call last): 
File "< pyshell # 8>", line 1, in «module» 
bb. printBB() 
TypeError: printBB() takes 0 positional arguments but 1 was given 


实际 上 由 于 Python 的 绑 定 机 制 , 这 里 自动 把 bb 对 象 作为 第 一 个 参数 传人 ,所 以 才 会 出 
现 TypeError, 
为 了 让 大 家 更 好 地 理解 ,再 深入 挖 一 挖 : 


>>> class CC: 
def setXY(self, x, y): 
self.x = x 
self.y = y 
def printXY(self): 
print(self.x, self.y) 


>>> dd = CC() 


可 以 使 用 __dict_ 查看 对 象 所 拥有 的 属性 : 


>>> dd. dict 


() 

>>> CC. dict _ 

mappingproxy((' dict ': «attribute ' dict  'of 'CC'objects», 'printXY': < function CC. printXY 
at 0x02D2D2B8 >, ' weakref  ': «attribute ' weakref “of 'CC'objects», 'setXY': < function CC. 
setXY at 0x02AC1420», ' doc ': None, ' module ': ' main '}) 


__dict_ 属 性 是 由 一 个 字典 组 成 ,字典 中 仅 有 实例 对 象 的 属性 ,不 显示 类 属性 和 特殊 属 


(D 骆驼 式 命名 法 (Camel-Case) 又 称 驼峰 命名 法 ,是 电脑 程式 编写 时 的 一 套 命名 规则 (惯例 )。 正 如 它 的 名 称 Camel 
Case 所 表示 的 那样 ,是 指 混合 使 用 大 小 写字 母 来 构成 变量 和 函数 的 名 字 ,程序 员 们 为 了 自己 的 代码 能 更 容易 在 同行 之 间 交 
流 , 所 以 多 采取 统一 的 可 读 性 比较 好 的 命名 方式 。 
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TE , 键 表示 的 是 属性 名 , 值 表 示 属 性 相应 的 数据 值 。 


>>> dd.setXY(4, 5) 
>>> dd. dict _ 
(x: 4, wv 5l 


现在 实例 对 象 dd 有 了 两 个 新 属性 ,而且 这 两 个 属性 仅 属 于 实例 对 象 的 : 


o 0C. dict 

mappingproxy((' doc ': None, ' dict ': «attribute ' dict  'of 'CC'objects», ' weakref  ': 
«attribute ' weakref  'of 'CC'objects», 'printXY': < function CC. printXY at 0x0370D2B8», ' 
module ': ' main ', 'setXY': < function CC. setXY at 0x034A1420 »]) 


为 什么 会 这 样 呢 ? 完全 是 归功 于 self 参数 : 当 实 例 对 象 dd 去 调用 setXY 方法 的 时 候 , 它 
传人 的 第 一 个 参数 就 是 dd, 那 么 self. x = 4.self. y = 5 也 就 相当 于 dd. x = 4. dd. y = 5, 所 
以 你 在 实例 对 象 ,甚至 类 对 象 中 都 看 不 到 x 和 y, 因 为 这 两 个 属性 是 只 属于 实例 对 象 dd 的 。 

接着 再 深入 一 下 ,请 思考 : 如 果 我 把 类 实例 删除 掉 , 实 例 对 象 dd 还 能 否 调用 printXY 
方法 ? 

>>> del CC 

答案 是 可 以 的 : 


>>> dd. printXY() 
45 


41.9 一 些 相关 的 BIF 


下 面 介 绍 与 类 和 对 象 相关 的 一 些 BIF( 内 置 函数 )。 


1. issubclass(class. classinfo) 


如 果 第 一 个 参数 (class) 是 第 二 个 参数 (classinfo) 的 一 个 子 类 , 则 返回 True, 否 则 返回 
False: 

(1) 一 个 类 被 认为 是 其 目 身 的 子 类 。 

(2) classinfo 可 以 是 类 对 象 组 成 的 元 组 ,只 要 class 是 其 中 任何 一 个 候选 类 的 子 类 , 则 返 
回 True。 

(3) 在 其 他 情况 下 ,会 抛 出 一 个 TypeError 异常 。 


>>> class A: 


pass 


>>> class B(A): 
pass 


>>> issubclass(B, A) 
True 
>>> issubclass(B, B) 
True 


>>> issubclass(B, object) # object 是 所 有 类 的 基 类 


True 
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>>> class C: 
pass 


>>> issubclass(B, C) 
False 


2. isinstanceCobject. classinfo) 


如 有 果 第 一 个 参数 (object) 是 第 二 个 参数 (classinfo) 的 实例 对 象 , 则 返回 True, 和 否则 返回 
False: 

(1) 如 果 object 是 classinfo 的 子 类 的 一 个 实例 ,也 符合 条 件 。 

(2) 如 果 第 一 个 参数 不 是 对 象 , 则 永远 返回 False。 

(3) classinfo 可 以 是 类 对 象 组 成 的 元 组 ,只 要 object 是 其 中 任何 一 个 候选 对 象 的 实例 , 则 
返回 True, 

(4) 如 果 第 二 个 参数 不 是 类 或 者 由 类 对 象 组 成 的 元 组 ,会 抛 出 一 个 TypeError 异常 。 


>>> issubclass(B, C) 
False 

>>> bl = B() 

>>> isinstance(bl, B) 
True 

>>> isinstance(bl, C) 
False 

>>> isinstance(b1, A) 
True 

>>> isinstance(bl, (A, B, C)) 
True 


Python 提供 以 下 几 个 BIF 用 于 访问 对 象 的 属性 。 
3. hasattrCobject. name) 


attr 即 attribute 的 缩写 ,属性 的 意思 。 接 下 来 将 要 介绍 的 几 个 BIF 都 是 跟 对 象 的 属性 有 
关系 的 ,例如 这 个 hasattr() 的 作用 就 是 测试 一 个 对 象 里 是 否 有 指定 的 属性 。 

第 一 个 参数 (object) 是 对 象 , 第 二 个 参数 (name) 是 属性 名 (属性 的 字符 串 名 字 ), 举 个 
例子 : 

class C: 


def init (self, x= 0): 


self.x = x 


»»cl = C() 
>>> hasattr(cl, 'x') # 注意 ,属性 名 要 用 引号 括 起 来 
True 


4. getattr(object. name| . default |) 


返回 对 象 指定 的 属性 值 ,如 果 指 定 的 属性 不 存在 , 则 返回 default( 可 选 参数 ) 的 值 ; 若 没有 
设置 default 参数 , 则 抛 出 ArttributeError 异常 。 
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>>> getattr(cl, 'x') 
0 
>>> getattr(cl, 'y') 
Traceback (most recent call last): 
File "< pyshell£7»", line 1, in < module» 
getattr(cl, 'y') 
AttributeError: 'C'object has no attribute 'y' 
>>> getattr(cl,，'y'，' 您 所 访问 的 属性 不 存在 … ') 
:您 所 访问 的 属性 不 存在 … ' 


5. setattr(Cobject. name. value) 


与 getattr OX JV ,setattr() 可 以 设置 对 象 中 指定 属性 的 值 , 如 条 指定 的 属性 不 存在 , 则 会 
新 建 属 性 并 赋值 。 


>>> setattr(cl, 'y', 'FishC') 
>>> getattr(cl, 'y') 
'FishC' 


6. delattrCobject. name) 


与 setattr ( ) 相反 , delattr() 用 于 删除 对 象 中 指定 的 属性 ,如 果 属 性 不 存在 , 则 抛 出 
AttributeError 异常 。 


>>> delattr(cl, 'y') 
>>> delattr(cl, 'z') 
Traceback (most recent call last): 
File "< pyshell #9>", line 1, in < module» 
delattr(c1, 'z') 
AttributeError: z 


7. property(fget= None, fset= None. fdel= None. doc = None) 


俗话 说 : 条 条 大 路 通 罗 马 。 同 样 是 完成 一 件 事 , Python 其 实 提 供 了 好 几 个 方式 供 你 选 
择 。property() 是 一 个 比较 奇 本 的 BIF, 它 的 作用 是 通过 属性 来 设置 属性 。 说 起 来 有 点 绕 , 看 


class C: 
def init (self, size= 10): 
self. size = size 


def getSize(self): 
return self.size 


def setSize(self, value): 


self.size - value 


def delSize(self): 
del self.size 
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gll sso» 
x 7 property(getSize, setSize, delSize) 


>>> C.X 

10 

>>> C.X = 12 

>>> C.X 

12 

>>> c. size 

12 

>>> del c.x 

>>> c.size 

Traceback (most recent call last): 
File "< pyshell # 20>", line 1, in «module» 


c. size 
AttributeError: 'C'object has no attribute 'size' 
property() 返 回 一 个 可 以 设置 属性 的 属性 ,当然 如 何 设 置 属性 还 是 需要 人 为 来 写 代 码 。 


第 一 个 参数 是 获得 属性 的 方法 名 (例子 中 是 getSize) ,第 二 个 参数 是 设置 属性 的 方法 名 (例子 
中 是 setSize) ,第 三 个 参数 是 删除 属性 的 方法 名 (例子 中 是 delSize) 。 

property() 有 什么 作用 呢 ? 举 个 例子 ,在 上 面 的 例题 中 ,为 用 户 提 供 setSize 方法 名 来 设 
置 size 属性 ,并 提供 getSize 方法 名 来 获取 属性 。 但 是 有 一 天 你 心血 来 潮 , 突 然 想 对 程序 进行 
大 改 ,就 可 能 需要 把 setSize 和 getSize 修改 为 setXSize 和 getXSize, 那 就 不 得 不 修改 用 户 调 用 
的 接口 ,这样 的 体验 非常 不 好 。 

有 了 property() ,所 有 问题 就 迎刃而解 了 ,因为 像 上 边 一 样 ,为 用 户 访问 size 属性 只 提供 
了 x 属 性 。 无 论 内 部 怎么 改动 ,只 需要 相应 的 修改 property() 的 参数 ,用 户 仍 然 只 需要 去 操作 
x 属性 即 可 ,没有 任何 影响 。 

很 神奇 是 吧 ? 想 知道 它 是 如 何 工作 的 ? 学 完 紧 接着 要 讲 的 魔法 方法 ,你 就 知道 了 。 
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42.1 构造 和 析 构 
— MN 
E B. 
在 此 之 前 ,已 经 接触 过 Python 最 常用 的 魔法 方法 ,小 甲鱼 也 把 魔法 方法 说 得 神 乎 其 神 ， 
似乎 用 了 就 可 以 化 腐朽 为 神奇 ,化 干戈 为 玉 吊 ,化 不 可 能 为 可 能 ! 
说 的 这 么 厉害 , 那 什 么 是 魔法 方法 呢 ? 
。 魔法 方法 总 是 被 双 下 划 线 包围 ,例如 _init _ O. 
。 魔法 方法 是 面 回 对 象 的 Python 的 一 切 ,如果 你 不 知道 魔法 方法 ,说 明 你 还 没 能 意识 到 
面向 对 象 的 Python 的 强大 。 
。 魔法 方法 的 “魔力 ”体现 在 它们 总 能 够 在 适当 的 时 候 被 调用 。 


12.1.1 . init Cself[ , ...)) 


之 前 我 们 讨论 过 _init__() 方 法 ,说 它 相 当 于 其 他 面 问 对 象 编程 语言 的 构造 方法 ,也 就 是 
类 在 实例 化 成 对 象 的 时 候 自 先 会 调用 的 一 个 方法 。 

有 读者 可 能 会 问 :“ 有 时 候 在 类 定义 时 写 __init__0O 〇 方法 ,有 时 候 却 没有 ,这 是 为 什么 呢 ?” 
这 是 我 在 论坛 中 看 到 的 一 个 问题 ,我 想 应 该 不 仅 只 有 一 位 朋友 有 疑惑 ,所 以 在 这 里 解释 下 : 在 
现实 生活 中 ,有 一 种 东西 迫使 我 们 去 努力 拼搏 ,使 我 们 获得 创造 力 和 生产 力 ,使 我 们 不 异 背 井 
离 乡 来 到 一 个 阴 生 的 城市 承受 孤独 和 彼 宽 ,这 个 东西 就 叫 需 求 …… 咽 ,我 想 我 已 经 很 好 地 回答 
了 这 个 问题 。 举 个 例子 : 


# pl2 l.py 
class Rectangle: 
定义 一 个 矩形 类 ， 
需要 长 和 宽 两 个 参数 ， 
拥有 计算 周 长 和 面积 两 个 方法 . 
需要 对 象 在 初始 化 的 时 候 拥 有 "长 "和 " 宽 " 两 个 参数 ， 
因此 需要 重 写 _init () 方 法 ,因为 我 们 说 过 ， 
__init _() 方 法 是 类 在 实例 化 成 对 象 的 时 候 首 先 会 调用 的 一 个 方法 ， 
大 家 可 以 理解 吗 ? 
def init (self, x, y): 
self.x = x 


self.y = y 
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def getPeri(self): 
return (self.x + self.y) * 2 


def getArea(self): 
return self.x * self.y 


>>> # 先 运行 p12_1.py 

>>> rect = Rectangle(3, 4) 
>>> rect.getPeri() 

14 

>>> rect. getArea( ) 

12 


这 里 需要 注意 的 是 ，_init__() 方 法 的 返回 值 一 定 是 None, 不 能 是 其 他 : 


>>> class A: 
def init (self): 
return "A for A- Cup" 


>>> cup = A() 
Traceback (most recent call last): 
File "< pyshell£17»", line 1, in < module» 
cup = A() 
TypeError: | init () should return None, not 'str' 


所 以 一 般 在 需要 进行 初始 化 的 时 候 才 重 写 _init _0O 〇 方法 ,现在 大 家 应 该 就 可 以 理解 造物 者 


的 迎 辑 了 。 但 是 你 要 知道 , 神 之 所 以 是 神 , 是 因为 他 做 什么 事 都 留 有 一 手 。 其 实 , 这 个 _init_ O 
并 不 是 实例 化 对 象 时 第 一 个 被 调用 的 魔法 方法 。 


at new (cls| ...]) 


_new_() 才 是 在 一 个 对 象 实例 化 的 时 候 所 调用 的 第 一 个 方法 。 它 跟 其 他 魔法 方法 不 
同 , 它 的 第 一 个 参数 不 是 self 而 是 这 个 类 (cls) ,而 其 他 的 参数 会 直接 传递 给 _init  O Jr 
法 的 。 

new_() 方 法 需要 返回 一 个 实例 对 象 ,通常 是 cls 这 个 类 实例 化 的 对 象 ,当然 你 也 可 以 
返回 其 他 对 和 象 。 

_new__0 〇 方法 平时 很 少 去 重 写 它 ,一 般 让 Python 用 默认 的 方案 执行 就 可 以 了 。 但 是 有 
一 种 情况 需要 重 写 这 个 魔法 方法 ,就 是 当 继 承 一 个 不 可 变 的 类 型 的 时 候 , 它 的 特性 就 显得 尤为 
重要 了 。 

class CapStr(str): 

def new (cls, string): 


string = string.upper() 
return str. new (cls, string) 


>>> a = CapStr("I love FishC. com") 
>>> a 


'I LOVE FISHC. COM' 
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这 里 返回 str.__new__(cls，string) 这 种 做 法 是 值得 推崇 的 ,只 需要 重 写 我 们 关注 的 那 部 
分 内 容 «EA BRL] E ZR VU 545 Python 的 默认 机 制 去 完成 就 可 以 了 , 毕 竞 它们 出 错 的 几率 
要 比 我 们 自己 写 小 得 多 。 


12.1.3 - del (self) 


Ri init _ () 和 __new__ () 方 法 是 对 象 的 构造 需 的 话 ,那么 Python 也 提供 了 一 个 析 
Fjas.MMfE.S del _ () 方 法 。 当 对 象 将 要 被 销毁 的 时 候 , 这 个 方法 就 会 被 调用 。 但 一 定 要 注意 
的 是 ,并 非 del x 就 相当 于 月 动 调用 x. del O. del () 方 法 是 当 垃 圾 回收 机 制 回 收 这 个 
对 象 的 时 候 调 用 的 。 举 个 例子 : 


>>> class C: 
def init (self): 
print("J£Jé init 方法 ,我 被 调用 了 …") 
def del (self): 
print(" 我 是 del 方法 ,我 被 调用 了 …") 


>>> cl = C() 

我 是 _init 方法 ,我 被 调用 了 … 
>>> c2 = cl 

>>> c3 = c2 

>>> del c1 

>>> del c2 

>>> del c3 


我 是 _del 方法 ,我 被 调用 了 -… 


(12.2 算术 运算 这 
[n] : Ta 14 
现在 来 讲 一 个 新 的 名 词 : 工厂 图 数 ,不 知道 大 家 还 有 没有 听 过 ? 其 实在 老 早 就 一 直 在 使 
HE ,但 由 于 那 时 候 还 没有 学 习 类 和 对 象 ,我 知道 那 时 候 说 了 也 是 白 说 。 但 我 知道 现在 来 告诉 
大 家 ,理解 起 来 就 不 再 是 问题 了 。 
Python2. 2 以 后 ,对 类 和 类 型 进行 了 统一 ,做 法 就 是 将 int() .floatO 、str(C) \list() tuple() 
这 些 BIF $2489 LJ. RŽ: 


>>> type(len) 

«class 'builtin function or method'> 
>>> type(int) 

«class 七 YPe > 

>>> type(dir) 

«class 'builtin function or method > 
>>> type(list) 

«class 'type'^ 


看 到 没有 ,普通 的 BIF 应 该 是 二 class 'builtin function or method '—, rfj T.J PA 2 pti E 
<class 'type' 盖 。 大 家 有 没有 觉得 这 个 过 class type' ^ RRA, E BD HR EP po 没 错 啦 ,如 果 定 


e 122 。 


第 了 2 章 mk» 


>>> class C: 
pass 


>>> type(C) 

«class 'type'^ 

它 的 类 型 也 是 type 类 型 ,也 就 是 类 对 象 ,其 实 所 谓 的 工厂 函数 ,其 实 就 是 一 个 类 对 象 。 当 
你 调用 它们 的 时 候 , 事 实 上 就 是 创建 一 个 相应 的 实例 对 象 : 


>>>a = int('123'") 
>>> b = int('345") 
>>a +t þ 

468 


HEREDERA: 原来 对 象 是 可 以 进行 计算 的 ! 其 实 你 早 该 发 现 这 个 问题 了 ， 
Python 中 无 处 不 对 象 , 当 在 求 a 十 b 等 于 多 少 的 时 候 , 事 实 上 Python 就 是 在 将 两 个 对 象 进行 
相 加 操作 。Python 的 魔法 方法 还 提供 了 自 定义 对 象 的 数值 处 理 ,通过 对 下 面 这 些 魔法 方法 的 
重 写 , 可 以 自 定 义 任何 对 象 间 的 算术 运算 。 
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K 12-1 列举 了 算数 运算 相关 的 魔法 方法 。 
表 12-1 算数 运算 相关 的 魔法 方法 


魔法 方法 € X 
. add (self, other) 定义 加 法 的 行为 : 十 
__sub__(self, other) 定义 减法 的 行为 : 一 
mul (self, other) 定义 乘法 的 行为 : * 
. truediv (self, other) 定义 真 除法 的 行为 : / 
. floordiv. _(self, other) 定义 整数 除法 的 行为 : // 
. mod (self. other) 定义 取 模 算法 的 行为 : % 
. divmod (self. other) 定义 当 被 divmod() 调 用 时 的 行为 
. pow. (self. other[ , modulo]) 4E X. M4 E power O i] FH] gx, ** 运算 时 的 行为 
. ]shift (self, other) 定义 按 位 左 移 位 的 行为 : << 
_ rshift (self, other) 定义 按 位 右 移 位 的 行为 : >> 
. and (self, other) 定义 按 位 与 操作 的 行为 : & 
. xor (self, other) 定义 按 位 异 或 操作 的 行为 : ^ 
. Or (self, other) 定义 按 位 或 操作 的 行为 : | 


举 个 例子 ,下 面 定义 一 个 比较 特 立 独行 的 类 ， 


>>> class New int(int): 
def | add (self, other): 
return int. sub (self, other) 
def sub (self, other): 
return int. add (self, other) 


>>>a = New int(3) 
»»» b = New int(5) 
>>a t þ 
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一 2 
>>a — b 
8 


那 有 些 谈 者 可 能 会 问 : 我 想 日 己 写 代码 ,不 想 通 过 调用 Python 默认 的 方案 行 不 行 ? 答案 
是 肯定 行 ,但 要 格外 小 心 ! 


>>> class Try int(int): 
def | add (self, other): 
return self + other 
def sub (self, other): 
return self - other 


»»» a = Try int(1) 
>>> b = Try int(3) 
>>a t+ þ 
Traceback (most recent call last): 
File "< pyshell #9 >", line 1, in < module > 
at b 
File "< pyshell # 6>", line3, in add _ 
return self + other 
File "< pyshell #6 >", line 3, in add _ 
return self + other 


# 此 处 省 略 很 多 行 … 
为 什么 会 陷入 无 限 递 归 呢 ?问题 就 出 在 这 里 : 


def add (self, other): 
return self + other 


当 对 象 涉 及 加 法 操作 时 ,自动 调用 魔法 方法 _add__〈) ,但 看 看 上 边 的 魔法 方法 写 的 是 什 
4? 写 的 是 return self + other, 也 就 是 返回 对 象 本 身 加 另外 一 个 对 象 ,这 不 就 又 自动 触发 调用 
. add ODETE? 这 样 就 形成 了 无 限 递 归 。 所 以 , 像 下 面 这 么 写 就 不 会 触发 无 限 递归 了 : 


>>> class New int(int): 
def | add (self, other): 
return int(self) + int(other) 
def sub (self, other): 
return int(self) - int(other) 


»»» a = New int(1) 
>>> b = New int(3) 


>>a + þ 

4 

上 边 介 绍 了 很 多 有 关 算 术 运 算 的 魔法 方法 ,意思 是 当 对 象 进 行 了 相关 的 算术 运算 ,自然 而 
然 就 会 自动 触发 对 应 的 魔法 方法 。 嘿 ,有 悟性 的 读者 就 会 说 :“ 哇 ,我 似乎 感觉 到 拥有 了 上 帝 


的 力量 。 没 错 吧 ?2? 

Python 正 是 如 此 ,对 于 初学 者 ,他 们 不 知道 魔法 方法 ,所 以 默认 的 魔法 方法 会 让 他 们 以 合 
乎 逻辑 的 形式 运行 。 但 当 你 逐步 深入 学 习 , 慢 慢 有 了 了 沉 诈 之 后 ,你 突然 发 现 如 果 有 更 多 的 灵活 
性 ,就 可 以 把 程序 写 得 更 好 …… 这 时 候 , Python 也 可 以 满足 你 。 通 过 对 指定 魔法 方法 的 重 写 ， 
尔 完 全 可 以 让 Python 根据 你 的 意愿 去 执行 。 
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>>> class int(int): 
def | add (self, other): 
return int. sub (self, other) 


»»» a = int('5!) 

>>>b = int('3!) 

>>a t þ 

2 

当然 ,我 这 样 做 从 逻辑 上 是 说 不 过 去 的 …… 我 只 是 想 跟 大 家 说 , 随 着 学 习 的 足够 深入 ， 


Python 人 允许 你 做 的 事情 就 更 多 、 更 灵活 ! 
12:2.2 反 运算 


X 12-2 列举 了 反 运 算 相 关 的 魔法 方法 。 
表 12-2 反 运 算 相关 的 魔法 方法 


魔法 方法 含 x 


. radd (self, other) 定义 加 法 的 行为 : 十 ( 当 左 操作 数 不 支 持 相应 的 操作 时 被 调用 ) 

. rsub (self, other) 定义 减法 的 行为 : 一 ( 当 左 操作 数 不 支 持 相 应 的 操作 时 被 调用 ) 

. rmul (self. other) 定义 乘法 的 行为 : *( 当 左 操 作 数 不 支持 相应 的 操作 时 被 调用 ) 

. rtruediv (self, other) | 定义 真 除法 的 行为 : /( 当 左 操 作 数 不 支持 相应 的 操作 时 被 调用 ) 

. rfloordiv (self, other) | 定义 整数 除法 的 行为 : //( 当 左 操 作 数 不 支持 相应 的 操作 时 被 调用 ) 

. rmod (self, other) 定义 取 模 算法 的 行为 : %( 当 左 操 作 数 不 支持 相应 的 操作 时 被 调用 ) 
__rdivmod (self, other) | 定义 当 被 divmod() 调 用 时 的 行为 ( 当 左 操作 数 不 支 持 相 应 的 操作 时 被 调用 ) 
定义 当 被 power() 调 用 或 «* 运算 时 的 行为 ( 当 左 操作 数 不 支 持 相 应 的 操作 时 
被 调用 ) 

. rlshift (self, other) 定义 按 位 左 移 位 的 行为 : S< OG Z6 PRAE BUR S FEAA ZB PRAE EST RC] FH D 

. rrshift (self. other) 定义 按 位 右 移 位 的 行为 : 二 二 ( 当 左 操作 数 不 支 持 相应 的 操作 时 被 调用 ) 

. rand (self. other) 定义 按 位 与 操作 的 行为 : &( 当 左 操 作 数 不 支持 相应 的 操作 时 被 调用 ) 
__rxor__(self, other) 定义 按 位 异 或 操作 的 行为 : ^( 当 左 操作 数 不 支 持 相应 的 操作 时 被 调用 ) 

. ror (self, other) 定义 按 位 或 操作 的 行为 : |( 当 左 操 作 数 不 支持 相应 的 操作 时 被 调用 ) 


rpow (self, other) 


不 难 发 现 ,这 里 的 反 运 算 魔法 方法 跟 上 节 介 绍 的 算术 运算 符 保持 一 一 对 应 ,不同 之 处 就 是 
反 运 算 的 魔法 方法 多 了 一 个 “r”, 例 如， add ORXIT radd QO。 举 个 例子 . 


»»adb 

£ 这 里 加 数 是 a, 被 加 数 是 b, 请 问 大 家 : 这 里 是 a 主动 还 是 b 主动 ? 

# 肯定 是 a 主动 ,对 不 对 ?( 就 像 "我 请 你 吃饭 "这 人 句 话 ,我 肯定 是 主动 ,所 以 应 该 是 由 我 给 钱 .但 是 , 如果 
那天 我 刚好 没 带 钱 , 那 就 叫 蹦 饭 ! 但 饭 钱 是 一 定 要 给 的 , 那 应 该 由 谁 来 给 ?肯定 就 只 能 由 来 给 了 .) 

# 那 反 运算 是 同样 一 个 道理 , 如 果 a 对 象 的 _add__() 方 法 没有 实现 或 者 不 支持 相应 的 操作 ,那么 
Python 就 会 自动 调用 b 的 _radd () 方 法 . 


>>> class Nint( int): 
def radd (self, other): 
return int. sub (other, self) 
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>>>a = Nint(5) 

>> b = Nint(3) 

>>a t þ 

8 

# 由 于 a 对 象 默 认 有 __ add__() 方 法 ,所 以 b 的 _radd_() 没 有 执行 
# 这 样 就 有 了 : 


关于 反 运 算 , 这 里 还 要 注意 一 点 : 对 于 a 十 b,b 的 __radd__(self, other) 的 self Æ b 对 
象 ,other 是 a 对 象 。 

所 以 不 能 这 么 与 : 

>>> class Nint(int): 


def  rsub (self, other): 
return int. sub (self, other) 


>>>a = Nint(5) 
255»3-a 
2 


所 以 对 于 注重 操作 数 顺序 的 运算 符 ( 例 如 减法 、 除 法 、 移 位 ), 在 重 写 反 运算 魔法 方法 的 时 
候 ,就 一 定 要 注意 顺序 问题 了 。 


12.2.3 EMALA 


Python 也 有 大 量 的 魔术 方法 可 以 来 定制 增 量 赋值 语句 , 增 量 赋值 其 实 就 是 一 种 偷懒 的 形 
式 , 它 将 操作 符 与 赋值 来 结合 起 来 。 例 如 : 


>>>a= a+t+Db 


# 写成 增 量 赋值 的 形式 就 是 : 


>>>a t= þ 
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一 元 操作 符 就 是 只 有 一 个 操作 数 的 意思 , 像 a 十 b 这 样 ,加 号 左右 有 a.b 两 个 操作 数 , 叫 
作 二 元 操作 符 。 只 有 一 个 操作 数 的 ,例如 把 减 号 放 在 一 个 操作 数 的 前 边 ,就 是 取 这 个 操作 数 的 
相反 数 的 意思 ,这 时 候 管 它 叫 负 号 。 

Python 支持 的 一 元 操作 符 主 要 有 __neg__ OO (表示 正 号 行为 )，_pos__()( 和 定义 负 号 行 
A). abs OGEX'4$ abs() 调 用 时 的 行为 ,就 是 取 绝 对 值 的 意思 ) ,还 有 一 个 _invert__() 
(定义 按 位 取 反 的 行为 ) 。 


42.3 简单 定制 


、 


基本 要 求 : 
。 定制 一 个 计时 器 的 类 ，。 
* start 和 stop 方法 代表 启动 计时 和 停止 计时 。 
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。 假设 计时 需 对 象 tt ,print(tl) 和 直接 调用 tl 均 显 示 结 果 。 

。 当 计 时 需 未 局 动 或 已 经 停止 计时 ,调用 stop 方法 会 给 予 温馨 的 提示 。 

。 两 个 计时 器 对 象 可 以 进行 相 加 .: tl + t2. 

。 只 能 使 用 提供 的 有 限 资 源 完成 。 

这 里 需要 限定 你 只 能 使 用 哪些 资源 ,因为 Python 的 模块 是 非常 多 的 ,你 要 是 直接 上 网 找 
个 写 好 的 模块 进来 , 那 就 达 不 到 锻炼 的 目的 了 。 

下 边 是 演示 : 


>>> tl = MyTimer() 
>>> 七 1 

未 开始 计时 ! 

>>> tl.stop() 

提示 : 请 先 调用 start() 开始 计时 ! 
>>> tl.start() 
计时 开始 … 

>>> t1 

提示 : 请 先 调用 stop() 结束 计时 ! 
>>> tl.stop() 

计时 结束 ! 

>>> t1 

总 共 运 行 了 5 秒 
>>> t2 = MyTimer() 
>>> t2.start() 
计时 开始 … 

>>> t2.stop() 

计时 结束 ! 

>>> t2 

总 共 运 行 了 6 黎 
>>> t1 F E2 

和 总共 运 行 了 11 秒 ' 


你 需要 下 面 的 资源 : 

。 使 用 time 模块 的 localtime 方法 获取 时 间 ( 有 关 time 模块 可 参考 : http://bbs. fishc. 
com/thread-51326-1-1. html). 

* time. localtime 返回 struct. time 的 时 间 格 式 。 

。 表现 你 的 类 : str. ORI repr__() 魔 法 方法 。 


>>> class A: 
def str (self): 
return "小 甲鱼 是 帅哥 " 


»»» a = A() 
>>> print(a) 
小 甲鱼 是 帅哥 
>> a 
« main .A object at 0x03260F30 > 
>>> class B: 

def __repr__(self): 

return "小 甲鱼 是 帅哥 " 
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>>>b = B() 
>>> þ 
小 甲鱼 是 帅哥 


有 了 这 些 知 识 , 可 以 开始 来 编写 代码 了 : 
import time as t 


class MyTimer: 
# 开始 计时 
def start(self) : 
self. start = t.localtime() 
print(" 计 时 开始 …") 
# 停止 计时 
def stop(slef): 
self.stop = t.localtime() 
print(" 计 时 结束 !") 
好 ,万 丈 高 楼 平地 起 ,把 地 基 写 好 后 ,应 该 考虑 怎么 进行 计算 了 . localtime() 返回 的 是 一 个 时 间 元 组 的 
结构 ,只 需要 前 边 6 个 元 素 , 然后 将 stop 的 元 素 依次 减 去 start 对 应 的 元 素 , 将 差 值 存放 在 一 个 新 的 列 
AB: 
# 停止 计时 
def stop(self): 
self.stop = t.localtime() 
self. calc() 
print(" 计 时 结束 !") 
# 内 部 方法 ,计算 运行 时 间 
def calc(self): 
self.lasted 
self. prompt = "总 共 运 行 了 " 
for index in range(6): 
self.lasted.append(self.stop[index] - self.start[index]) 
self. prompt += str(self.lasted[index]) 
print(self. prompt) 


ll 
rn 
u 


>>> tl = MyTimer() 

>>> tl.start() 

计时 开始 … 

>>> tl.stop() 

总 共 运 行 了 000003 

计时 结束 ! 

已 经 基本 实现 计时 功能 了 , 接 下 来 需要 完成 "print(t1) 和 直接 调用 tl 均 显 示 结 果 ", 那 就 要 通过 重 写 __ 
str _() 和 _ repr__() 魔 法 方法 来 实现 : 


def str (self): 
return self.prompt 
repr = str _ 


>>> tl = MyTimer() 
>>> tl.start() 
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计时 开始 … 
>>> tl.stop() 
计时 结束 ! 
>>> tl 


— A— 


总 共 运 行 了 000002 
似乎 做 得 不 错 了 ,但 这 里 还 有 一 些 问 题 。 假 设 用 户 不 按 篆 理 出 牌 ,问题 就 会 很 多 : 


>>> tl = MyTimer() 
>>> 七 1 
Traceback (most recent call last): 
File "< pyshell# 11>", line 1, in < module» 
t1 
File "C:MPython34MlibVidlelibNrpc.py", line 614, in displayhook 
text = repr(value) 
File "C:NUsersVFishCO00MDesktopNtest.py", line 5, in str _ 
return self.prompt 
AttributeError: 'MyTimer' object has no attribute 'prompt' 


当 直 接 执行 tl 的 时 候 , Python 会 调用 _str __() 魔 法 方法 ,但 它 却说 这 个 类 没有 prompt 
属性 。prompt 属性 在 哪里 定义 的 ? 在 _calc() 方 法 里 定义 的 ,对 不 ? 但 是 没有 执行 stop() 方 
法 ，calc() 方 法 就 没有 被 调用 到 ,所 以 也 就 没有 prompt 属性 的 定义 了 。 

要 解决 这 个 问题 也 很 简单 ,大 家 应 该 还 记得 在 类 里 边 ,用 得 最 多 的 一 个 魔法 方法 是 什么 ? 


是 __init__O 〇 嘛 ,所 有 属于 实例 对 象 的 变量 只 要 在 这 里 边 先 定 义 ,就 不 会 出 现 这 样 的 问题 了 。 


def init (self): 
self. prompt = "未 开始 计时 !" 
self.lasted = [] 
self.start = 0 
self.stop = 0 


>>> t1 = MYTimer( ) 

>>> 七 1 

未 开始 计时 ! 

>>> tl.start() 

Traceback (most recent call last): 

File "<pyshell#2>", line 1, in <module> 

tl.start() 

TypeError: 'int'object is not callable 


这 里 又 出 错 了 (当然 我 是 故意 的 ) ,大 家 先 检 查 一 下 是 什么 问题 ? 

其 实 会 导致 这 个 问题 ,是 因 犯 了 一 个 微妙 的 错误 ,这 样 的 错误 通 篆 很 容易 丽 忽 , 而 且 很 难 
HEA., Python 这 里 抛 出 了 一 个 异常 : TypeError: 'int' object is not callable, 

仔细 有 瞧 ,在 调用 start() 方 法 的 时 候 报销 ,也 就 是 说 ,Python 认为 start 是 一 个 整 型 变量 ,而 
不 是 一 个 方法 。 为 什么 呢 ? 大 家 看 __init__() 方 法 里 ,是 不 是 也 命名 了 一 个 叫 作 self. start 的 
变量 ,如果 类 中 的 方法 名 和 属性 同名 ,属性 会 覆盖 方法 。 

好 了 ,让 我 们 把 所 有 的 self. start 和 self. end 都 改 为 self. begin 和 self. end HE ! 

现在 程序 没 问 题 了 ,但 显示 时 间 是 000003 这 样 不 大 人 性 化 ,还 是 希望 可 以 按照 “年 月 日 小 
时 分 钟 秒 ” 这 么 去 显示 ,然后 值 为 0 的 就 不 显示 啦 , 这 样 才 是 人 看 的 嘛 ,对 不 对 ?! 所 以 这 里 添 
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加 一 个 列表 用 来 存放 对 应 的 单位 : 


def init (self): 
self. unit = ['£p', 'H', 'X', vhi', ob, Eb] 
self. prompt = "未 开始 计时 !" 
self. lasted [] 
self.begin = 0 
self.end = 0 
# 计算 运行 时 间 
def calc(self): 
self.lasted [] 
self. prompt = "总 共 运 行 了 " 
for index in range(6): 
self.lasted.append(self.end[index] - self.begin[index]) 
if self. lasted[ index]: 
self. prompt += (str(self.lasted[index]) + self.unit[index]) 


>>> tl = MyTimer() 
>>> tl.start() 
计时 开始 … 

>>> tl.stop() 

计时 结束 ! 

>>> 七 1 


总 共 运 行 了 2*9 
然后 在 适当 的 地 方 增加 温 二 提示 : 


# 开始 计时 
def start(self) : 
self. begin = t.localtime() 
self. prompt = "提示 : 请 先 调用 stop() 结束 计时 !" 
print(" 计 时 开始 …"”) 
# 停止 计时 
def stop( self) : 
if not self.begin: 
print(" 提 示 : 请 先 调用 start() 开始 计时 ! ") 
else: 
self.end = t.localtime() 
self. calc() 
print(" 计 时 结束 ! ") 
# 计算 运行 时 间 
def calc(self): 
self.lasted 
self.prompt 


[] 
"总 共 运 行 了 " 
for index in range(6): 

self.lasted.append(self.end[index] - self.begin[index]) 

if self. lasted[ index]: 

self.prompt += (str(self.lasted[index]) + self.unit[index]) 

# 为 下 一 轮 计算 初始 化 变量 
self.begin = 0 
self.end = 0 
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最 后 ,再 重 写 一 个 魔法 方法 _add__0O 〇 ,让 两 个 计时 器 对 象 相 加 会 自动 返回 时 间 的 和 : 


def add (self, other): 
prompt = "总 共 运 行 了 " 
result = [] 
for index in range(6): 
result.append(self.lasted[index] + other. lasted[ index]) 
if result[index]: 
prompt += (str(result[index]) + self.unit[index]) 
return prompt 


>>> tl = MyTimer() 
>>> tl 

未 开始 计时 ! 

>>> tl.stop() 
提示 : 请 先 调用 start() 开始 计时 ! 
>>> tl.start() 
计时 开始 … 

>>> tl 
提示 : 请 先 调用 stop() 结束 计时 ! 
>>> tl.stop() 

计时 结束 ! 

>>> t1 

总 共 运 行 了 8$ 
>>> t2 = MyTimer() 
>>> t2.start() 
计时 开始 … 

>>> t2.stop() 

计时 结束 ! 

>>> t2 

总 共 运 行 了 4 秒 
2» tl t t2 

总 共 运行 了 12 秒 ， 


看 上 去 代码 是 不 错 , 也 能 正常 计算 了 。 但 是 ,这 个 程序 有 几 点 不 足 还 需要 大 家 课 后 来 思考 
一 下 如 何 修改 : 

CD 如 果 开 始 计时 的 时 间 是 (2022 年 2 月 22 日 16;30;30), 停 止 时 间 是 (2025 年 1 月 23 
日 15:30;30), 那 么 按照 用 停止 时 间 减 开始 时 间 的 计算 方式 就 会 出 现 负 数 , 你 应 该 对 此 做 一 些 
转换 。 

(2) 现在 的 计算 机 速度 都 非常 快 ,而 这 个 程序 最 小 的 计算 单位 却 只 是 秒 ,精度 是 远 远 不 
够 的 。 


12.4 属性 访问 


个 BIF 适当 地 去 访问 属性 : 


>>> class C: 
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def init (self): 
self.x = 'X- man' 


>>>c = C() 
>>> C.X 
» ini 
>>> getattr(c, 'x', kHix mE) 
We 
>>> getattr(c, 'y', ' 木 有 这 个 属性 ') 
' 木 有 这 个 属性 ' 
>>> setattr(c, 'y', 'Yellow') 
>>> getattr(c, 'y' WARTE ') 
'Yellow' 
>>> delattr(c, 'x') 
>>> C.X 
Traceback (most recent call last): 
File "< pyshell # 18>", line 1, in < module > 
EX 
AttributeError: 'C'object has no attribute 'x' 


然后 还 介绍 了 一 个 叫 作 property O 因数 的 用 法 ,这 个 property() 使 得 我 们 可 以 用 属性 去 
访问 属性 : 


# pl2 2.py 
class C: 
def init (self, size- 10): 
self.size - size 
def getSize(self): 
return self.size 
def setSize(self, value): 
self.size - value 
def delSize(self): 
del self.size 
x = property(getSize, setSize, delSize) 


>>> # 先 运行 p12_2.py 

>>>c = C() 

25» c.X 

10 

>>> C.X = 12 

>>> C.X 

12 

>>> c. size 

12 

>>> del c. x 

>>> C. size 

Traceback (most recent call last): 

File "< pyshell # 20>", line 1, in < module» 

C. size 

AttributeError: 'C'object has no attribute 'size' 


那么 关于 属性 访问 ,肯定 也 有 相应 的 魔法 方法 来 管理 。 通 过 对 这 些 魔法 方法 的 重 写 ,你 可 
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以 随心 所 欲 地 控制 对 和 象 的 属性 访问 。 大 家 是 不 是 想 想 就 有 点 小 激动 了 呢 ? 来 吧 , 让 我 们 开 
始 吧 ! 


表 12-3 列举 了 属性 相关 的 魔法 方法 。 
表 12-3 属性 相关 的 魔法 方法 
魔法 方法 * 义 
__getattr (self, name) 定义 当 用 户 试图 获取 一 个 不 存在 的 属性 时 的 行为 
| getattribute (self, name) 定义 当 该 类 的 属性 被 访问 时 的 行为 
| setattr (self, name, value) 定义 当 一 个 属性 被 设置 时 的 行为 
. delattr (self, name) 定义 当 一 个 属性 被 删除 时 的 行为 
做 个 小 测试 : 
# pl2 3.py 
class C: 


def | getattribute (self, name): 
print( getattribute') 
# 使 用 super( ) 调 用 object 基 类 的 ”getattribute () 方 法 
return super(). getattribute (name) 
def setattr (self, name, value): 
print('setattr') 
super().  setattr (name, value) 
def  delattr (self, name): 
print('delattr') 
super().  delattr (name) 
def  getattr (self, name): 
print('getattr') 


>>> # 先 运行 p12_3.py 
>>>C = C() 

>>> C.X 

getattribute 

getattr 

>>> C.X = 1 

setattr 

55» C.X 

getattribute 

1 

>>> del c.x 

delattr 

>>> setattr(c, 'y', 'Yellow') 
setattr 


这 几 个 魔法 方法 在 使 用 上 需要 注意 的 是 ,有 一 个 死 循 环 的 陷阱 ,初学 者 比较 容易 中 招 ,还 
是 通过 一 个 实例 来 讲解 ! 写 一 个 矩形 类 (Rectangle) ,默认 有 宽 (width) 和 高 (height) 两 个 属 
性 ; 如 果 为 一 个 叫 square 的 属性 赋值 ,那么 说 明 这 是 一 个 正方 形 , 值 就 是 正方 形 的 边 长 ,此 时 
宽 和 高 都 应 该 等 于 边 长 。 

# pl2 4.py 


class Rectangle: 
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def init (self, width= 0, height = 0): 
self.width - width 
self.height - height 
def | setattr (self, name, value): 
if name == 'square': 
self.width = value 
self.height = value 
else: 
self.name - value 
def getArea(self): 
return self.width * self.height 


>>> # 先 运行 p12_4.py 
>>> rl = Rectangle(4, 5) 
Traceback (most recent call last): 
File "< pyshell # 181 >", line 1, in < module» 
rl - Rectangle(4, 5) 
File "E:\p12_4. py", line3, in init _ 
self.width = width 
File" E:Xp12 4.py", line 11, in  setattr _ 
self.name - value 
File" E:\p12_4. py", line 11, in setattr - 
self.name - value 


RuntimeError: maximum recursion depth exceeded while calling a Python object 


这 是 为 什么 呢 ? 
分 析 一 下 : 实例 化 对 象 .调用 _init __() 方 法 ,在 这 里 给 self. width 和 self. heigth 分 别 初 


始 化 赋值 。 一 发 生 赋 值 操作 ,就 会 自动 触发 setattr__() 魔 法 方法 ,width 和 height 两 个 属性 
被 赋值 ,于 是 执行 else 的 下 边 的 语句 ,就 又 变 成 了 self. width= value, 那 么 就 相当 于 又 触发 了 
. setattr _() 魔 法 方法 了 , 死 循 环 陷阱 就 是 这 么 来 的 。 


那 怎么 解决 呢 ? 我 这 里 说 两 个 方法 。 第 一 个 就 是 跟 刚 才 一 样 ,用 super() 来 调用 基 类 的 


__setattr () ,那么 这 样 就 依赖 基 类 的 方法 来 实现 赋值 : 


else: 
super().  setattr (name, value) 


>> # 先 执 行 修改 后 的 p12_4. py 
>>> rl = Rectangle(4, 5) 

>>> rl.getArea() 

20 

>>> rl.square = 10 

>>> rl.getArea() 

100 


另 一 种 方法 就 是 给 特殊 属性 _dict _ 赋值。 对 象 有 一 个 特殊 的 属性 , 叫 作 __dict__, 它 的 


作用 是 以 字典 的 形式 显示 出 当前 对 象 的 所 有 属性 以 及 相对 应 的 值 : 


el, dict 
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('height': 10, 'width': 10) 
可 以 这 么 改 : 


else: 
self. dict [name] = value 


>> # 先 执 行 修改 后 的 p12_4. py 
>>> rl = Rectangle(4, 5) 

>>> rl.getArea() 

20 

>>> rl.square = 10 

>>> rl.getArea() 

100 


42.5 描述 符 (property 83/8 38) 
- 


大 家 都 在 问 :“ 这 propertyO IE SE F Y E429? 怎么 这 么 神奇 ?7 如 采 你 想 知 道 property O PR 
数 的 实现 原理 ,那么 本 市 的 内 容 就 不 能 错过 。 
本 节 要 讲 的 内 容 叫 作 描 述 符 (descriptor) ,用 一 句 话 来 解释 ,描述 符 就 是 将 某 种 特殊 类 型 
的 类 的 实例 指派 给 男 一 个 类 的 属性 。 那 什么 是 特殊 类 型 的 类 呢 ?” 就 是 至 少 要 在 这 个 类 里 边 定 
X. get O, set CO 〇 或 _delete _0O 〇 三 个 特殊 方法 中 的 任意 一 个 。 
K 12-4 列举 了 描述 符 相 关 的 魔法 方法 。 
表 12-4 描述 符 相 关 的 魔法 方法 


魔法 方法 含 义 
. get (self. instance. owner) 用 于 访问 属性 , 它 返 回 属性 的 值 
__set (self, instance. value) 将 在 属性 分 配 操作 中 调用 ,不 返回 任何 内 容 
. delete (self. instance) 控制 删除 操作 ,不 返回 任何 内 容 
举 个 最 直观 的 例子 : 
# pl2 5.py 


class MyDescriptor: 
def get (self, instance, owner): 
print("getting...", self, instance, owner) 
def set (self, instance, value): 
print("setting...", self, instance, value) 
def delete (self, instance): 
print("deleting...", self, instance) 


class Test: 
x = MyDescriptor() 

由 于 MyDescriptor 实现 了 get. ()、 set () 和 delete () 方 法 ,并 且 将 它 的 类 实例 
指派 给 Test 类 的 属性 ,所 以 MyDescriptor 就 是 所 谓 摘 述 符 类 。 到 这 里 ,大 家 有 没有 看 到 
property() 的 影子 ? 
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好 ,实例 化 Test 类 ,然后 尝试 对 x 属性 进行 各 种 操作 ,看 看 描述 符 类 会 有 怎样 的 啊 应 : 


>>> test = Test() 
>>> test. x 
getting... < main .myDescriptor object at 0x02D7FE90 > < main .Test object at 0x02FE0930 > 


«class ' main .Test'» 


当 访 问 x 属 性 的 时 候 , Python 会 自动 调用 描述 符 的 __get__O 〇 方法 , 几 个 参数 的 内 容 分 别 
是 : self 是 描述 符 类 自身 的 实例 ; instance 是 这 个 描述 符 的 拥有 者 所 在 的 类 的 实例 ,在 这 里 也 
就 是 Test 类 的 实例 ; owner 是 这 个 描述 符 的 拥有 者 所 在 的 类 本 号 。 


>>> test.x = 'X- man' 
setting... < main  .MyDescriptor object at 0x02D7FE90» < main  . Test object at Ox02FE0930 
> X- man 


对 x 属 性 进行 赋值 操作 的 时 候 ,Python 会 日 动 调用 __set__() 方 法 ,前 两 个 参数 跟 __get__() 
方法 是 一 样 的 ,最 后 一 个 参数 value 是 等 号 右边 的 值 。 
最 后 一 个 del 操作 也 是 同样 的 道理 . 


>>> del test.x 
deleting... < main .MyDescriptor object at 0x02D7FE90» « main .Test object at 0x02FE0930 > 


只 要 弄 清 楚 描 述 符 , 那 么 property 的 秘密 就 不 再 是 秘密 了 ! property 事实 上 就 是 一 个 描 
述 符 类 。 下 边 就 定义 一 个 属于 我 们 自己 的 MyProperty: 


# p12_6. py 
class MyProperty: 
def | init (self, fget = None, fset = None, fdel = None): 
self.fget - fget 
self.fset - fset 
self.fdel - fdel 
def get (self, instance, owner): 
return self.fget(instance) 
def set (self, instance, value): 
self.fset(instance, value) 
def | delete (self, instance): 
self.fdel(instance) 


class C: 
def init (self): 
self. x - None 
def getX( self): 
return self. x 
def setX(self, value): 
self. x - value 
def delX(self): 
del self. x 


x = MyProperty(getX, setX, delX) 


>> # 先 执 行 p12 6.py 
>>>c = C() 
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>>> c.x = 'X- man' 

25» c.x 

'X — man' 

222 C. X 

'X —- man' 

>>> del c.x 

>>> C. X 

Traceback (most recent call last): 

File "< pyshell # 37>", line 1, in < module > 

i. x 

AttributeError: 'C'object has no attribute ' x' 


看 ,这 不 就 自己 实现 property O PR ZC E Wk fij 2E ? ! 

最 后 讲 一 个 实例 : 先 定义 一 个 温度 类 ,然后 定义 两 个 描述 符 类 用 于 描述 摄氏 度 和 华氏 度 
两 个 属性 。 两 个 属性 会 日 动 进行 转换 ,也 就 是 说 ,你 可 以 给 摄氏 度 这 个 属性 赋值 ,然后 打印 的 
华氏 度 属性 是 日 动 转换 后 的 结果 。 


# pl2 7.py 
class Celsius: 
def init (self, value = 26.0): 
self.value = float(value) 
def get (self, instance, owner): 
return self. value 
def set (self, instance, value): 


self.value = float(value) 


class Fahrenheit: 
def get (self, instance, owner): 
return instance.cel * 1.8 + 32 
def set (self, instance, value): 
instance. cel = (float(value) - 32) / 1.8 


class Temperature: 
cel - Celsius() 
fah = Fahrenheit() 


>>> £ 先 执行 p12 7.py 
>>> temp = Temperature() 
>>> temp.cel 

26.0 

>>> temp. fah 
78.80000000000001 


12.6 定制 序列 


常言 道 ,无 规矩 不 成 方圆 , 讲 的 是 万 事 万 物 的 发 展 都 是 要 在 一 定 的 规则 下 进行 ,只 有 遵照 
一 定 的 协议 去 做 了 ,事情 才能 往 正确 的 方向 上 发 展 。 
本 节 要 谈 的 是 定制 容器 ,要 想 成 功 地 实现 容器 的 定制 , 便 需 要 先 谈 一 谈 协议 。 协 议 是 什么 
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呢 ? 协议 (Protocol) 与 其 他 编程 语言 中 的 接口 很 相似 , 它 规定 哪些 方法 必须 要 和 定义。 然而 ,在 
Python 中 的 协议 就 显得 不 那么 正式 。 事 实 上 ,在 Python 中 ,协议 更 像 是 一 种 指南 。 
这 有 点 像 Python 极力 推 尝 的 鸭子 类 型 (扩展 阅 谈 : http://bbs. fishc. com/thread-51471- 
1-1. html) , 当 看 到 一 只 马 走 起 来 像 鸭 子 .游泳 起 来 像 鸡 子 、. 叫 起 来 也 像 鸡 子 ,那么 这 只 马 就 可 
以 被 称 为 鸭子 。Python 就 是 这 样 , 并 不 会 严格 地 要 求 你 一 定 要 怎样 去 做 ,而 是 让 你 徘 着 自觉 
和 经 验 把 事情 做 好 1 
在 Python 中 , 像 序 列 类 型 (如 列表 、 元 组 .字符 串 ) 或 映射 类 型 (如 字典 ) 都 是 属于 容 需 类 
型 。 本 闻 来 讲 定制 容 需 , 那 就 必须 要 知道 ,定制 容 需 有 关 的 一 些 协议 : 
。 如 采 说 你 希望 定制 的 容 右 是 不 可 变 的 话 , 你 只 需要 定义 __len__() 和 __getitem__() 
方法 。 
。 如 果 你 希望 定制 的 容 需 是 可 变 的 话 ,除了 _len OR getitem _0O 〇 方法 ,你 还 需要 定 
义 setitem () 和 delitem (〈) 两 个 方法 。 
表 12-5 列举 了 和 定制 容器 类 型 相关 的 魔法 方法 及 含义 。 
表 12-5 定制 容器 类 型 相关 的 魔法 方法 


魔法 方法 * x 
. len | (selD XE X. 24 8 len() 函 数 调 用 时 的 行为 (返回 容器 中 元 素 的 个 数 ) 
__getitem__(self, key) 定义 获取 容器 中 指定 元 素 的 行为 ,相当 于 self[ key ] 
__setitem__(self, key, value) 定义 设置 容器 中 指定 元 素 的 行为 ,相当 于 self[ key] = value 
__delitem__(self, key) 定义 删除 容器 中 指定 元 素 的 行为 ,相当 于 del self[ key ] 
. iter (self) 定义 当 和 迭代 容 器 中 的 元 素 的 行为 
. reversed (self) 定义 当 被 reversed O 图 数 调 用 时 的 行为 
__contains (self, item) 定义 当 使 用 成 员 测 试 运 算 符 (in 或 not in) 时 的 行为 


验证 大 家 学 习 能 力 的 时 候 到 了 。 现 在 动 动手 ,编写 一 个 不 可 改变 的 目 定 义 列表 ,要 求 记录 
列表 中 每 个 元 素 被 访问 的 次 数 。 


# pl2 8.py 
class CountList: 
def | init (self, *args): 
self.values = [x for x in args] 
self.count = (].fromkeys(range(len(self.values)), 0) 
# 这 里 使 用 列表 的 下 标 作 为 字典 的 键 , 注 意 不 能 用 元 素 作 为 字典 的 键 
# 因为 列表 的 不 同 下 标 可 能 有 值 一 样 的 元 素 , 但 字典 不 能 有 两 个 相同 的 键 
def len (self): 
return len(self.values) 
def getitem (self, key): 
self.count[key] += 1 
return self. values[key] 


>>> # 先 运 行 p12_8.py 

>>> cl = CountList(1, 3, 5, 7, 9) 
>>> c2 = CountList(2, 4, 6, 8, 10) 
>>> cl[1] 

3 

>>> c2[1] 

4 
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>>> cl[1] + c2[1] 

- 

>>> cl.count 

[0: 0, 1: 2, 2: 0, 3: 0, 4: 0} 
>>> c2.count 

(0: 0, 1: 2, 2: 0, 3: 0, 4: 0) 


ou 迭代 器 


iE. Ni 得 很 多 了 ， 现在 不 仅 在 数学 领域 使 用 这 个 间 ， ey ede 
经 过 多 次 迭代 ,质量 和 品质 已 经 有 了 大 幅度 提高 ,这 次 事件 纯 属 意外 ……: 

大 家 应 该 听 出 来 了 , 碗 代 的 意思 类 似 于 循环 ,每 一 次 重复 的 过 程 被 称 为 一 次 迭代 的 过 程 ， 
而 每 一 次 从 代 得 到 的 结果 会 被 用 来 作为 下 一 次 迭代 的 初始 值 。 提 供 迭 代 方 法 的 容 副 称 为 迭代 
大, 通常 接触 的 迭代 此 有 序列 (列表 、 元 组 ,字符 串 ) 还 有 字典 也 是 迭代 右 ,都 支持 迭代 的 操作 。 

举 个 例子 ,通常 使 用 for 语句 来 进行 迭代 : 


>>> for i in "FishC": 


print(i) 


Q5 0 m. nj 


字符 串 就 是 一 个 容器 ,同时 也 是 一 个 迭代 器 ,for 语句 的 作用 就 是 触发 这 个 迭代 器 的 迭代 
功能 ,每 次 从 容 带 里 依次 拿 出 一 个 数据 ,这 就 是 迭代 操作 。 

字典 和 文件 也 是 支持 迭代 操作 的 ; 
>>> links = {' 鱼 C 工 作 室 ': "http://www. fishc.com', \ 

' 鱼 C 论 坛 ': 'http://bbs. fishc.com', V 

' C HAE ': http://blog. fishc.com', \ 

:支持 小 甲鱼 ': http: //£fishc. taobao. com ') 
>>> for each in links: 

print('$s -> %s' €& (each, links[each])) 


鱼 C 博 客 -> http://blog. fishc.com 

鱼 C 论 坛 -> http://bbs. fishc.com 

f c 工作 室 -> http://www. fishc.com 
支持 小 甲鱼 -»http://fishc. taobao.com 


关于 迭代 ,Python 提供 了 两 个 BIF: 
e jter(), 
* next(), 


X — 7 4 ai R iter O SLE SIT 35 fV as ,调用 next O3S A di EL zz R Ib P — 4 f& «£5 
后 怎么 样 结束 呢 ? 如 果 和 迭代 需 没 有 值 可 以 返回 了 ,Python 会 抛 出 一 个 叫 作 Stoplteration 的 
TH: 


3D mn 
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>>> string = "FishC" 

>>> it = iter(string) 

>>> next(it) 

RI 

>>> next(it) 

TE 

>>> next(it) 

'g' 

>>> next(it) 

'h' 

>>> next( it) 

Tok 

>>> next( it) 

Traceback (most recent call last): 

File "< pyshell # 37>", line 1, in < module > 

next( it) 

StopIteration 


所 以 ,利用 这 两 个 BIF ,可 以 分 析出 for 语句 其 实 是 这 么 工作 的 : 


>>> string = "FishC" 
>>> it = iter(string) 
>>> while True: 
try: 
each = next(it) 
except StopIteration: 
break 
print(each) 


Q 5 uu m "n 


那么 关于 实现 迭代 需 的 魔法 方法 有 两 个 : 

e 1iter() , 

e  next() , 

一 个 容器 如 果 是 迭代 器 , 那 就 必须 实现 _iter __() 魔 法 方法 ,这 个 方法 实际 上 就 是 返回 和 迭 
代 器 本 身 。 接 下 来 重点 要 实现 的 是 _next__() 魔 法 方法 ,因为 它 决 定 了 和 迭代 的 规则 。 人 简单 举 
个 例子 大 家 就 清楚 了 : 


>>> class Fibs: 

def init (self): 
self.a = 0 
self.b = 1 

def iter (self): 
return self 

def next (self): 
self.a, self.b = self.b, self.a + self.b 
return self.a 
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>>> fibs = Fibs() 
>>> for each in fibs: 


if each « 20: 
print(each) 
else: 
break 
1 
1 
2 
3 
5 
8 
13 


好 了 ,这 个 迭代 需 的 唯一 亮点 就 是 没有 终点 ,所 以 如 果 没 有 跳出 循环 TE ASI IZ. 
那 可 不 可 以 加 一 个 参数 ,用 于 控制 迭代 的 范围 呢 ? 


>>> class Fibs: 

def | init (self, n-20): 
self.a = 0 
self.b = 1 
self.n = n 

def iter (self): 
return self 

def next (self): 
self.a, self.b = self.b, self.a + self.b 
if self.a > self.n: 

raise Stoplteration 

return self.a 


>>> fibs = Fibs() 
>>> for each in fibs: 


print(each) 


© UO OP Pp 
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>>> fibs = Fibs(10) 
>>> for each in fibs: 


print(each) 
1 
1 
2 
3 
a 
8 
是 不 是 很 容易 呢 ? I, Python 就 是 可 以 这 么 简 简 单单 的 一 门 语 言 ! 
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12.8 生成 器 (乱入 ) 


和 迭代 需 可 以 说 是 Python 近 几 年 来 引入 的 最 强大 的 两 个 特性 ,但 是 生成 颖 的 学 习 , 并 不 涉及 魔 
法 方法 ,甚至 它 巧妙 地 避 开 了 类 和 对 象 , 仅 通 过 普通 的 函数 就 可 以 实现 了 ，。 

由 于 生成 硕 的 概念 要 比较 高 级 一 些 , 所 以 在 图 数 章节 就 没有 提 及 它 , 还 是 那 句 老话 ,因为 
那 时 候 讲 了 也 是 白 讲 。 学 习 就 是 这 么 一 个 渐进 的 过 程 , 像 上 节 介 绍 的 迭代 器 ,很 多 人 学 完 之 后 
感叹 : 哎呀 ,Python 怎么 就 这 么 简单 呐 ! 但 如 果 在 讲 循环 那个 章节 来 讲 迭 代 帮 的 实现 原理 ， 
那 大 家 势必 就 会 一 头 筋 水 了 了 ，。 

正如 刚才 说 的 ,生成 右 其 实 是 迭代 各 的 一 种 实现 , 那 既然 迭代 可 以 实现 ,为 何 还 要 生成 一 
呢 ? 有 一 句 话 叫 * 存 在 即 合理 ”, 生 成 需 的 发 明 一 方面 是 为 了 使 得 Python 更 为 简洁 ,因为 ,过 
代 需 需要 我 们 目 己 去 定义 一 个 类 和 实现 相关 的 方法 ,而 生成 天 则 只 需要 在 普通 的 困 数 中 加 上 
一 个 yield 语句 即 可 , 

在 另 一 个 更 重要 的 方面 ,生成 需 的 发 明 ,使 得 Python 模仿 协同 程序 的 概念 得 以 实现 。 所 
谓 协 同 程序 ,就 是 可 以 运行 的 独立 函数 调用 , 哨 数 可 以 暂 信 或 者 挂 起 ,并 在 需要 的 时 候 从 程序 
离开 的 地 方 继续 或 者 重新 开始 。 

对 于 调用 一 个 普通 的 Python 函数 ,一 般 是 从 函数 的 第 一 行 代码 开始 执行 ,结束 于 return 
语句 、 异 向 或 者 图 数 所 有 语句 执行 完毕 。 一 旦 函数 将 控制 权 交 还 给 调用 者 ,就 意味 着 全 部 结 
束 。 困 数 中 做 的 所 有 工作 以 及 保存 在 局 部 变量 中 的 数据 都 将 丢失 。 上 再 次 调用 这 个 函数 时 ,一 
切 都 将 从 头 创建 。 

Python 是 通过 生成 需 来 实现 类 似 于 协同 程序 的 概念 : 生成 希 可 以 暂时 挂 起 男 数 ,并 保留 
痕 数 的 局 部 变量 等 数据 ,然后 在 再 次 调用 它 的 时 候 , 从 上 次 暂停 的 位 置 继续 执行 下 去 。 

好 ,多 说 不 如 实干 , 举 个 例子 : 

>>> def myGen(): 

print(" 生 成 器 被 执行 !") 
yield 1 
yield 2 


>>> myG = myGen() 
>>> next(myG) 
生成 器 被 执行 ! 
1 
>>> next(myG) 
2 
>>> next(myG) 
Traceback (most recent call last): 
File "< pyshell£12»", line 1, in < module» 


next(myG) 
StopIteration 

1E AU X ZEE A] , R RE ,一 个 StopIteration 异常 就 会 被 抛 出 。 由 于 Python 的 

for 循环 会 自动 调用 next() 方 法 和 处 理 StopIteration 异常 ,所 以 for 循环 当然 也 是 可 以 对 生成 
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器 产生 作用 的 : 


>>> for i in myGen() : 
print(i) 

生成 器 被 执行 ! 

1 

2 
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>>> def fibs(): 


a-0 

b= 1 

while True: 
a b=batb 
yield a 


>>> for each in fibs(): 


if each > 100: 
break 

print(each) 

1 

1 

2 

3 

S 

8 

13 

21 

34 

55 

89 


事 到 如 今 LR OG. RREME S 90 de dE SEX UB AU AAAI XE SEXUS 
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>>>a = [i for i inrange(100) if not(i * 2) and i % 3] 


其 实 上 边 这 个 列表 推导 式 求 的 就 是 100 以 内 ,能 够 被 2 整除 ,但 不 能 够 被 3 整除 的 所 有 
TC 


>>> a 
[2, 4, 8, 10, 14, 16, 20, 22, 26, 28, 32, 34, 38, 40, 44, 46, 50, 52, 56, 58, 62, 64, 68, 70, 74, 
76, 80, 82, 86, 88, 92, 94, 98] 


Python3 除了 有 列表 推导 式 之 外 ,还 有 字典 推导 式 : 


>>>b = {i:i % 2 == 0 for i in range(10)) 
>>> þ 
{0: True, 1: False, 2: True, 3: False, 4: True, 5: False, 6: True, 7: False, 8: True, 9: False} 


还 有 集合 推导 式 : 
>>>c = {iftoriin[1,1, 2, 3, 3, 4, 5, 5, 5, 6, 7, 7, 8]) 
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>>> C 
RS 2, 3, 4, 5, 6, 1, 8} 


那 这 时 有 该 者 可 能 就 会 想 :“ 那 按照 这 种 剧情 发 展 下 去 ,应 该 会 有 字符 串 推 导 式 和 元 组 推 


导 式 吧 ?” 不 妨 试 试 : 
>>> d = "i for i in 'I love FishC. con! '" 
>> d 


"i for i in 'I love FishC. com! '" 


WR ,不 行 , 因 为 只 要 在 双 引 号 内 ,所 有 的 东西 都 变 成 了 字符 串 ,所 以 不 存在 字符 串 推导 式 
那 元 组 推导 式 呢 ? 
>>>e= (ifor i in range(10)) 


>>> e 
< generator object < genexpr > at 0x03135300 > 


Mi? 似乎 这 个 不 是 什么 推导 式 , 大 家 看 出 来 什么 门道 了 吗 ? generator, 多 么 熟悉 的 单词 


啊 ,不 就 是 生成 硕 嘛 ! 没 错 , 用 普通 的 小 括号 括 起 来 的 正 是 生成 硕 推 导 式 ,来 证 明 一 下 : 


>>> next(e) 
0 
>>> next(e) 
1 
>>> next(e) 
2 
>>> next(e) 
3 
>>> next(e) 
4 


用 for 语句 把 剩 下 的 都 打印 出 来 : 


>>> for each in e: 
print(each) 


O 0 N O) Ul 


还 有 一 点 特性 更 牛 L HE DX sie TEE ST: CULA TE 23 BR RS RE, T VA E B3 HEER, i As FEDES 


括号 : 


>>> sum(i for i in range(100) if i % 2) 
2500 


关于 生成 器 的 技术 要 点 ,这 里 小 甲鱼 还 给 大 家 转 了 一 篇 不 错 的 文章 ,大 家 课 后 可 以 参考 学 


习 一 下 : 解释 yield 和 Generators /EJA $8) Chttp: / /bbs. fishc. com/thread-56023-1-1. html). 
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13.1 模块 就 是 程序 


本 节 将 给 大 家 介绍 一 个 新 的 知识 , 叫 作 模块 。 一 早 我 们 就 说 过 模块 是 更 高 级 的 封装 。 涪 
到 封 闻 ,驳回 顾 一 下 学 过 的 有 哪些 ? 

容 需 ,例如 列表 元 组 .字符 串 .字典 等 ,这 些 是 对 数据 的 封装 。 

限 数 ,是 对 语句 的 封装 。 

类 ,是 对 方法 和 属性 的 封 交 ,也 就 是 对 果 数 和 数据 的 封闭 。 

那 本 节 学 习 的 模块 ,又 是 怎样 一 种 封装 形式 呢 ? 要 解答 什么 是 模块 这 个 问题 ,其 实 只 需要 
用 一 句 话 就 可 以 概括 : 模块 就 是 程序 。 没 错 ,模块 ,就 是 平时 写 的 任何 代码 ,保存 的 每 一 个 . py 
结尾 的 文件 ,都 是 一 个 独立 的 模块 。 

举 个 简单 的 例子 ,在 Python 的 安装 目录 下 创建 一 个 叫 hello. py 的 文件 ,代码 如 下 : 

def hi(): 

print("Hi everyone, I love FishC. com!") 

当 我 把 这 个 文件 保存 起 来 的 时 候 , 它 就 是 一 个 独立 的 Python 模块 了 (注意 : 为 了 让 默认 
的 IDLE 可 以 找到 这 个 模块 ,需要 把 文件 放 在 Python f Z22€ Ho P). 

这 时 就 可 以 在 IDLE 中 导入 模块 了 : 

# 模块 的 名 字 就 是 刚刚 保存 的 那个 文件 名 (不 带 后 绥 哦 ) 

>>> import hello 

好 , 那 试 试 调用 一 下 hello 模块 中 的 hi 函数 : 


>>> hi() 
Traceback (most recent call last): 
File "<pyshell#1>", line 1, in «module» 
hi() 


NameError: name 'hi'is not defined 


MR? KET! 从 这 个 错误 信息 可 以 看 出 错误 的 根源 是 Python 找 不 到 hiO 〇 0) 这 个 函数 。 为 
什么 会 这 样 呢 ? 明明 在 hello 文件 中 已 经 定义 了 hiO PRAG 3X H. Python 却说 我 们 未 定义 ? 
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43.2 命名 空间 
Ws 

什么 是 命名 空间 呢 ? 命名 空间 (Namespace) 表 示 标 识 符 (identifier) 的 可 见 范围 。 一 个 标 
识 符 可 在 多 个 命名 空间 中 定义 , 它 在 不 同 命名 空间 中 的 含义 是 互 不 相干 的 。 

比如 你 们 班 里 有 个 叫 小 花 的 同学 ,隔壁 班 也 恰好 有 个 叫 小 花 的 同学 ,由 于 她 们 在 两 个 不 同 
的 班级 ,所 以 老师 上 课 点 名 直接 叫 小 花 是 没有 问题 的 。 但 如 果 是 期 末 统 考 ,那么 整个 年 级 的 成 
绩 排 名 就 分 不 清 到 底 是 你 班 还 是 隔壁 班 的 小 花 排 第 一 了 。 那 怎么 办 呢 ? 解决 的 方法 很 简单 ， 
就 是 在 名 字 的 前 边 写 上 相应 的 班级 就 可 以 了 。 在 这 个 例子 中 ,班级 就 是 命名 空间 。 

在 Python 中 ,每 个 模块 都 会 维护 一 个 独立 的 命名 空间 ,我 们 应 该 将 模块 名 加 上 ,才能 够 
正常 使 用 模块 中 的 函数 : 


>>> hello. hi() 


Hi everyone, I love FishC. com! 


^e 


143.3 导入 模块 


下 面 介 绍 一 下 几 种 导入 模块 的 方法 。 
1. import 模块 名 


直接 import, 但 是 在 调用 模块 中 的 函数 的 时 候 , 需 要 加 上 模块 的 命名 空间 。 重 新 写 一 个 
例子 ,用 于 计算 摄氏 度 和 华氏 度 的 相互 转换 . 


# p13 1.py 

def c2f(cel): 
fah = cel * 1.8 + 32 
return fah 


def f2c(fah): 
cel = (fah - 32) / 1.8 
return cel 


再 与 一 个 文件 来 导入 刚才 的 模块 : 


# pl3 2.py 
import p13 1 


print("32 BE EC HE 
print("99 华氏 度 


% .2f ÆRE" % p13 1.c2f(32) ) 
% .2f 摄氏 度 " % p13 1.f2c(99)) 


2. from 模块 名 import 函数 名 


刚才 那 种 方法 有 些 谈 者 可 能 不 是 很 喜欢 ,因为 这 个 模块 的 名 字 太 长 了 ,每 次 调用 模块 里 的 
图 数 都 要 写 这 么 长 的 命名 空间 ,真是 费力 不 讨好 又 容易 出 钳 。 所 以 呢 , 就 有 了 了 这 种 方法 。 
这 种 导入 方法 会 下 接 将 模块 的 命名 空间 覆盖 进来 ,所 以 调用 的 时 候 也 就 不 需要 再 加 上 命 


e 146 * 


第 13 章 ”模块 | 有 > 
Aa Dr: 


# pl3 3.py 
from pl3 1 import c2f, f2c 


print("32 摄氏 度 % .2f ERE" $% c2f(32)) 
print("99 华氏 度 % .2f 摄氏 度 " $% f2c(99)) 


这 里 还 可 以 使 用 通配符 星 号 ( x ) 来 导入 模块 中 所 有 的 命名 空间 : 


from pl3 1 import * 


但 是 强烈 要 求 大 家 不 要 使 用 这 种 方法 ,因为 这 样 做 会 使 得 命名 空间 的 优势 荡然 无 存 , 一 不 
小 心 还 会 陷入 名 字 混 乱 的 局 面 。 


3. import 模块 名 as 新 名 字 


最 后 一 种 方法 是 作者 本 人 大 力 推举 的 ,你 可 以 用 这 种 方法 给 导入 的 命名 空间 礁 换 一 个 新 
的 名 字 。 


# p13_4. py 
import p13_1 as tc 


print("32 摄氏 度 = %.2f 华氏 度 " % tc.c2f(32)) 
print("99 华氏 度 = &.2f 摄氏 度 " $% tc.f2c(99)) 


13.4 = name -7' main ' 


前 边 已 经 介绍 了 模块 的 作用 以 及 模块 的 用 法 。 yaam F, SRN EEEE hÁ 

第 一 点 无 疑 就 是 封装 组 织 Python 的 代码 ,你 想 想 ,当代 码 量 非 常 大 的 时 候 , 可 以 有 组 织 
有 纪律 地 根据 不 同 的 功能 ,将 代码 分 制 成 不 同 的 模块 。 这 样 ,每 个 模块 相互 之 间 是 独立 开 的 。 
那 大 家 说 说 ,这 代码 是 分 开 了 容易 阅读 和 测试 ,还 是 拟 在 一 块 容易 ? 我 们 肯定 是 更 愿意 去 阅读 
——— me 

后 ,模块 的 男 一 个 重要 的 特性 就 是 实现 代码 的 重用 。 比 如 你 写 了 一 段 发 送 邮 件 的 代码 ， 

ME HOM. 你 就 可 以 封装 成 一 个 独立 的 模块 ,以 后 在 任何 程序 需要 发 送 邮 件 
的 时 候 , 只 需要 导入 这 个 模块 就 可 以 直接 使 用 了 ,而 不 用 在 每 个 需要 发 送 邮件 的 程序 中 都 重复 
写 同 样 的 代码 。 

相信 很 多 读者 朋友 已 经 开始 去 阅读 别人 的 代码 ( 注 : AA Umi 
会 让 你 的 技术 水 平 飞速 提高 ) ,在 阅读 代码 时 ,会 发 现 很 多 代码 中 都 有 让 __name_ ——' 
main__' 这 么 一 行 语句 ,但 却 不 知道 有 什么 用 ? 

先 举 个 例子 ,一般 写 完 代码 要 先 测 试 下 : 

# p13_5. py 

def c2f (cel): 


fah = cel * 1.8 + 32 
return fah 
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def f2c(fah): 


cel = (fah - 32) / 1.8 


return cel 
def test(): 
print(" 测 试 ,0 摄氏 度 = % .2f ÆRE" $ c2f(0)) 
print(" 测 试 ,0 华氏 度 = %.2f 摄氏 度 " % f2c(0)) 
test() 
单独 这 个 运行 是 没 问题 的 : 
>>> 
测试 ,0 摄氏 度 = 32.00 华氏 度 
测试 ,0 华氏 度 = -17.78 摄氏 度 
>>> 


但 如 果 是 在 另 一 个 文件 中 (p13 6. py) 导 和 后 再 调用 : 


# p13 6.py 
import pl3 5 as tc 


print("32 摄氏 度 = $&.2f 华氏 度 " % tc.c2£(32)) 
print("99 华氏 度 = % .2f 摄氏 度 " & tc.f2c(99)) 


就 会 出 现 问 题 : 


>>> 


测试 ,0 摄氏 度 = 32.00 华氏 度 
测试 ,0 华氏 度 = -17.78 摄氏 度 


32 摄氏 度 = 89.60 华氏 度 
99 ERE = 37.22 摄氏 度 


>>> 


Python 把 模块 中 (p13_5. py) fr di PA Zt, — H JL3AUET T «ix JE E d MAE E A eee eee iE 
免 这 种 情况 的 关键 在 于 : ib Python 知道 该 模块 是 作为 程序 运行 还 是 导 和 人 到 其 他 程序 中 。 为 
了 实现 这 一 点 ,需要 使 用 模块 的 _name_ JE: 


>>> name - 

' main ' 

>>> tc. name 
Dij € 


在 作为 程序 运行 的 时 候 ，_name__ 属性 的 值 是 | main 
值 就 是 该 模块 的 名 字 了 。 因 此 ,你 就 不 难 理解 if __name__ 


Hr. 


# pl3 7.py 
def c2f(cel): 


fah = cel * 1.8 + 32 


return fah 


def f2c(fah): 


cel = (fah - 32) / 1.8 
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' main _ ' 这 名 代码 的 意 
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return cel 


def test(): 
print(" 测 试 ,0 摄氏 度 = % .2f 华氏 度 ”$% c2f(0)) 
print(" 测 试 ,0 华氏 度 = %.2f 摄氏 度 " % f2c(0)) 
if name  -- ' main ': 
test() 


上 面 的 代码 确保 只 有 单独 运行 p13_7. py 时 才 会 执行 test OPR ZI, 


43.5 搜索 路 径 
A 


^s 


现在 遇 到 一 个 问题 , 写 好 的 模块 应 该 放 在 哪里 ? 有 读者 可 能 会 说 :“ 不 是 应 该 放 在 和 导入 
这 个 模块 文件 的 源 代码 同一 个 文件 夹 内 吗 ?” 没 错 , 这 是 一 种 方案 。 但 有 的 读者 可 能 不 希望 把 
所 有 的 代码 都 放 在 一 个 框 里 ,因为 我 想 通 过 文件 夹 的 方式 更 好 地 组 织 我 的 代码 。 可 以 做 到 吗 ? 
没 问 题 ,但 在 此 之 前 你 必须 先 理解 搜索 路 径 这 个 概念 。 

Python 模块 的 导入 需要 一 个 路 径 搜 索 的 过 程 。 就 是 说 ,你 导入 一 个 叫 作 hello 的 模块 , 那 
A Python 会 在 预定 义 好 的 搜索 路 径 中 寻找 一 个 叫 作 hello. py 的 模块 文件 一 一 如 果 有 , 则 导 
入 模块 ; 如 果 没 有 , 则 导入 失败 。 而 这 个 搜索 路 径 , 就 是 一 组 目录 ,可 以 通过 sys 模块 中 的 
path 变量 显示 出 来 (不 同 的 机 需 上 显示 的 路 径 信 息 可 能 不 一 样 ) : 


>>> import sys 

>>> sys. path 

['', 'C:\\Python34\\Lib\\idlelib', 'C:\\WINDOWS\\SYSTEM32\\python34. zip', 'C:\\Python34\\DLLs', 
'C:\\Python34\\1ib', 'C:\\Python34', 'C:\\Python34\\lib\\site - packages '] 


列 出 的 这 些 路 径 都 是 Python 在 导 和 人 模块 操作 时 会 去 搜索 的 ,尽管 这 些 模块 都 可 以 使 用 ， 
但 site-packages 目录 是 最 佳 的 选择 ,因为 它 就 是 用 来 做 这 些 事情 的 。 

当然 按照 这 个 逻辑 来 说 ,只 需要 告诉 Python 你 的 模块 文件 在 哪里 找 , Python 在 导入 模块 
的 时 候 就 能 正确 地 找到 它 : 


>> # 假如 存放 模块 (p13_7.py) 的 位 置 是 : C:\Python34\test\M1 
>>> import p13 7 
Traceback (most recent call last): 

File "<pyshell#2>", line 1, in <module> 

import pl3_7 

ImportError: No module named ' pl3 7' 
>> # 直接 导入 会 出 错 , 因为 搜索 路 径 并 不 包含 模块 所 在 的 位 置 
>>> # 那 把 模块 所 在 的 位 置 添加 到 搜索 路 径 中 : 
>>> sys. path. append("C:\\Python34\\test\\M1") 
>>> sys. path 
['', 'C:\\Python34\\Lib\\idlelib', 'C:\\WINDOWS\\SYSTEM32\\python34. zip', 'C:\\Python34\\DLLs', 
'C:\\Python34\\lib', 'C:\\Python34', 'C:\\Python34\\lib\\site - packages', 'C:\\Python34\\test\\ 
M1'] 
>>> import p13_7 as tc 
>>> print("32 摄氏 度 = % .2f ÆRE" % tc.c2f(32)) 
32 摄氏 度 = 89.60 华氏 度 
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在 实际 的 开发 中 ,一 个 大 型 的 系统 有 成 千 上 万 的 Python 模块 是 很 正常 的 事情 。 单 单 用 
模块 来 定义 Python 的 功能 显然 还 不 够 ,如 果 都 放 在 一 起 显然 不 好 管理 并 有 是 有 命名 冲突 的 可 
能 ,因此 Python 中 也 出 现 了 包 的 概念 。 

什么 是 包 呢 ?事实 上 有 点 像 刚刚 所 做 的 : 把 模块 分 门 别 类 地 存放 在 不 同 的 文件 夹 , 然 后 
把 各 个 文件 夹 的 位 置 告 诉 Python。 只 是 包 的 实现 要 更 为 简洁 一 些 。 创 建 一 个 包 的 具体 操作 
如 下 : 

(D 创建 一 个 文件 夹 , 用 于 存放 相关 的 模块 ,文件 夹 的 名 字 即 包 的 名 字 ; 

(2) 在 文件 夹 中 创建 一 个 __init__. py 的 模块 文件 ,内 容 可 以 为 空 ; 


(3) 将 相关 的 模块 放 入 文件 夹 中 。 
fs 


注意 第 (2) 步 ,必须 要 在 每 一 个 包 目 录 下 建立 一 个 init .py 的 模块 ,可 以 是 一 个 空 


文件 ,也 可 以 写 一 些 初始 化 代码 。 这 个 是 Python 的 规定 ,用 来 告诉 Python 将 该 目录 当成 


一 个 包 来 处 理 。 


接 下 来 就 是 在 程序 中 导入 包 的 模块 ( 包 名 . 模块 名 ) : 


# pl3 8.py 
# 将 p13 7.py 放 在 了 文件 夹 M1 中 
import M1.p13 7 as tc 


print("32 摄氏 度 
print("99 华氏 度 


% .2f ÆRE" $% tc.c2£(32)) 
% .2f 摄氏 度 " $% tc.f2c(99) ) 


看 ,程序 正常 执行 ， 

> e 

32 摄氏 度 = 89.60 华氏 度 
99 华氏 度 = 37.22 摄氏 度 
>>> 


13.7 像 个 极 客 一 样 去 思考 


Python 的 设计 哲学 是 “优雅 明确、 简单 ,因此 ,Python 开发 者 的 哲学 是 “用 一 种 方法 ,最 
好 是 只 有 一 种 方法 来 做 一 件 事 ”。 虽 然 作 者 常常 鼓励 大 家 多 思考 ,条 条 大 路 通 罗 马 , 那 是 为 了 
训练 大 家 的 发 散 性 思维 。 但 在 正式 编程 中 ,如 果 有 完善 的 并 且 经 过 严密 测试 过 的 模块 可 以 实 
现 , 那 么 建议 大 家 最 好 使 用 现成 的 模块 。 

Bi Python Mik kA Python 标准 库 ,说 “Python 目 己 市 看 电池 ”, 指 的 就 是 标准 库 里 的 
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模块 。 这 些 模 块 都 极其 有 用 ,一 般 常 见 的 任务 者 有 相应 的 模块 可 以 实现 。 不 过 Python 标准 
库 里 包含 的 模块 有 数 百 个 之 多 ,一 个 个 模块 单独 来 讲 , 那 着 实 不 现实 。 所 以 本 节 主 要 是 将 告诉 
大 家 如 何 独 立地 探究 模块 。 

对 于 Python 来 说 ,学 习 资 料 其实 一 直 都 在 身边 。 这 里 给 大 家 分 析 下 遇 到 问题 , 目 己 应 该 
如 何 去 找 答案 (其 实 90% 的 问题 都 可 以 自己 找到 解决 方法 )。 首 先 要 找 的 就 是 Python 的 文 
档 , 选 择 Help 一 Python Docs 选项 。 

来 看 下 Python 的 官方 帮助 文档 由 几 部 分 构成 ,如 图 13-1 Brzn o 


€: Python » 3.4.3 Documentation » modules | index 


Python 3.4.3 documentation 


Welcome! This is the documentation for Python 3.4.3, last updated Feb 24, 2015. 


Parts of the documentation: 


What's new in Python 3.4? Installing Python Modules 
or all "What's new" documents since 2.0 installing from the Python Package Index 
& other sources 


Tutorial 

start here Distributing Python Modules 
publishing modules for installation by 

Library Reference others 


keep this under your pillow 


Extending and Embedding 
Language Reference tutorial for C/C++ programmers 
describes syntax and language elements 


Python/C API 
Python Setup and Usage reference for C/C++ programmers 
how to use Python on different platforms 


FAQs 
Python HOWTOs frequently asked questions (with 
in-depth documents on specific topics answers!) 


图 13-1 Python 官方 帮助 文档 


Parts of the documentation: 


Python 文档 的 主要 组 成 部 分 


What's new in Python 3. 4? 
or all "What's new" documents since 2. 0: 


Python 3. 4 有 什么 新 的 特性 和 改进 ? 或 者 列举 日 2.0 以 后 的 所 有 新 特性 。 


Tutorial: 


简易 教程 ,简单 地 介绍 Python 的 语法 ,这 个 系列 教程 比 它 要 详细 得 多 ,所 以 这 里 大 家 可 以 不 
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用 看 。 


Library Reference: 

Python 官方 的 枕 边 书 ,这 里 边 详细 地 列举 了 Python MA I5 A E PR CRUS TEE Fg B8] e AP BOX IT 
用 法 ,非常 详细 ,但 是 你 看 不 完 的 , 当 作 字典 来 查 就 可 以 了 。 

Installing Python Modules: 

教 你 如 何 安 装 Python 的 第 三 方 模块 。 


Distributing Python Modules: 
教 你 如 何 发 布 Python 的 第 三 方 模块 。 


Python 除了 标准 库 的 几 百 个 模块 之 外 ,还 有 个 Pypi 社区 ,收集 了 了 全球 的 Python 爱好 者 贡献 
的 模块 ,你 自己 写 了 一 个 模块 觉得 要 分 享 给 世界 ,你 也 可 以 发 布 上 去 。 


Language Reference: 


讨论 Python 的 语法 和 设计 哲学 。 


Python Setup and Usage: 
介绍 在 各 个 平台 上 如 何 使 用 Python. 


Python HOWTOs: 
这 里 是 深入 探讨 一 些 特定 的 主题 。 


Extending and Embedding: 
介绍 如 何 用 C 和 C++ 开发 Python 的 扩展 模块 。 


FAQs: 
常见 问题 解答 。 

男 外 值得 一 提 的 是 PEP( 如 果 查 看 文档 经 常会 看 到 PEP 后 边 加 上 一 些 数字 编号 )。PEP 
是 Python Enhancement Proposals 的 缩写 ,翻译 过 来 就 是 Python 增强 建议 书 的 意思 。 它 是 用 
来 规范 与 定义 Python 的 各 种 加 强 与 延伸 功能 的 技术 规格 ,好 让 Python 开发 社区 能 有 共同 亲 
循 的 依据 。 

每 个 PEP 都 有 一 个 唯一 的 编号 ,这 个 编号 一 旦 给 定 了 就 不 会 再 改变 。 例 如 ,PEP 3000 就 
是 用 来 定义 Python3 的 相关 技术 规格 ; 而 PEP 333 则 是 Python 的 Web 应 用 程序 界面 WSGI 
(Web Server Gateway Interface 1.0) 的 规范 。 关 于 PEP 本 号 的 相关 规范 是 定义 在 PEP 1, 而 
PEP 8 则 定义 了 Python 代码 的 风格 指南 。 有 关 PEP 的 列表 大 家 可 以 参考 PEP 0: https:// 
www. python. org/ dev/peps/ 。 

党 个 例子 ,说 说 作者 平时 遇 到 问题 是 怎么 目 救 的 。 前 边 不 是 举 了 一 个 计时 需 的 例子 嘛 , 那 
是 自己 写 的 一 个 计时 需 。 其 实在 实际 应 用 中 ,不 建议 大 家 上 自己 动手 写 计 时 需 , 因 为 有 很 多 未 知 
的 因素 会 影响 到 你 的 数据 。 所 以 建议 用 现成 的 模块 一 一 timeit 来 对 你 的 代码 进行 计时 。 
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那 现 在 假设 我 不 知道 timeit 模块 的 用 法 ,应 该 如 何 下 手 ? 
首先 应 该 先 查 找 帮 助 文档 ,可 以 使 用 文档 的 搜索 或 者 索引 功能 
词 之 后 ,文档 第 一 个 显示 出 来 的 内 容 就 是 你 需要 的 ,如 图 13-2 所 示 。 


一 般 情况 下 输入 关键 


目录 (C) FEIN) | sex) | sso | 
键入 关键 字 进 行 查找 (W: 
|timeit 


timeit (module) 

timeit command line option 
-c, --clock 
-h, --help 
-n N, --number-N 


-p, --process 
-r N, --repeat=N 
-S S, --setup-S 
-t, --time 
-V --verbose 
timeit() (in module timeit) 
(timeit. Timer method) 


图 13-2 ”如 何在 帮助 文档 中 找到 自己 需要 的 内 容 
首先 出 现 的 是 关于 这 个 模块 的 介绍 ,如 图 13-3 Bron 


€: Python » 3.4.3 Documentation » The Python Standard Library previous | next | modules | index ES 
» 27. Debugging and Profiling » 


2/[.5. timeit — Measure execution time of 
small code snippets 


Source code: Lib/timeit.py 


This module provides a simple way to time small bits of Python code. It has both a 
Command-Line Interface as well as a callable one. It avoids a number of common traps 
for measuring execution times. See also Tim Peters' introduction to the "Algorithms" 
chapter in the Python Cookbook, published by O'Reilly. 


图 13-3 timeit 模块 
帮 大 家 大 概 翻译 下 : 


timeit 一 Measure execution time of small code snippets 


timeit 模块 详解 一 一 准确 测量 小 段 代 码 的 执行 时 间 
Source code: Lib/timeit. py( 该 模块 所 在 的 位 置 ) 


timeit 模块 提供 了 测量 Python 小 段 代码 执行 时 间 的 方法 。 它 既 可 以 在 命令 行 界 面 直 接 使 用 ， 
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也 可 以 通过 导入 模块 进行 调用 。 该 模块 灵活 地 避 开 了 测量 执行 时 间 时 容易 出 现 的 错误 。 
接 下 来 就 是 简单 的 使 用 方法 介绍 ,如 图 13-4 所 示 。 


2/.5.1. Basic Examples 


The following example shows how the Command-Line Interface can be used to compare 
three different expressions: 


用 » 


$ python3 -m timeit . join(str(n) for n in range(100))' 
10000 loops, best of 3: 30.2 usec per loop 

$ python3 -m timeit '"-". join([str(n) for n in range(100)])' 
10000 loops, best of 3: 27.5 usec per loop 

$ python3 -m timeit '^-^. join(map(str, range(100)))' 


10000 loops, best of 3: 23.2 usec per loop 


This can be achieved from the Python Interface with: 


>>> import timeit 

>>> timeit. timeit (o ^-^. join(str(n) for n in range(100))', number-10000) 
0. 3018611848820001 

>>> timeit. timeit( "-". join([str(n) for n in range(100)])', number-10000) 
0. 2727368790656328 

>>> timeit. timeit  "-". join(map(str, range(100)))', number-10000) 

0. 23702679807320237 


Note however that timeit will automatically determine the number of repetitions only 
when the command-line interface is used. In the Examples section you can find more 


advanced examples. 


图 13-4 timeit 模块 简单 的 使 用 方法 介绍 


接着 是 指出 这 个 模块 里 边 包 含 哪些 类 函数 .变量 及 其 功能 和 用 法 。 最 后 就 是 实际 应 用 的 
例子 。 基 本 上 所 有 的 模块 文档 都 会 遵循 这 么 一 个 顺序 。 如 果 你 认为 要 快速 学 习 一 个 模块 都 得 
读 这 么 长 的 文档 的 话 , 那 你 还 是 “too young. too simple" f , 

快速 掌握 一 个 模块 的 用 法 ,可 以 利用 IDLE。 先 导入 模块 . 


>>> import timeit 


可 以 调用 _doc_ 属性 ,查看 这 个 模块 的 简介 ,可 以 用 print 把 它 带 格式 的 打印 出 来 : 


>>> print(timeit. doc ) 
Tool for measuring execution time of small code snippets. 


This module avoids a number of common traps for measuring execution 
times. See also Tim Peters' introduction to the Algorithms chapter in 
the Python Cookbook, published by O'Reilly. 


Library usage: see the Timer class. 


Command line usage: 
python timeit.:py[-nN][-rN][-sS][-t][-cl[-pl[-h][--] [statement] 


Options: 
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- n/ -- number N: how many times to execute 'statement' (default: see below) 
- r/ -- repeat N: how many times to repeat the timer (default 3) 

- s/ -— setup S: statement to be executed once initially (default 'pass') 

— p/ -- process: use time.process time() (default is time.perf counter()) 
- t/ -- time: use time. time() (deprecated) 

- c/ -- clock: use time.clock() (deprecated) 

- v/ -- verbose: print raw timing results; repeat for more digits precision 
- h/ -- help: print this usage message and exit 

—— : separate options from statement, use when statement starts with 一 
statement: statement to be timed (default 'pass') 


A multi —- line statement may be given by specifying each line as a 
separate argument; indented lines are possible by enclosing an 
argument in quotes and using leading spaces. Multiple - s options are 
treated similarly. 


If —n is not given, a suitable number of loops is calculated by trying 
successive powers of 10 until the total time is at least 0.2 seconds. 


Note: there is a certain baseline overhead associated with executing a 
pass statement. It differs between versions. The code here doesn't try 
to hide it, but you should be aware of it. The baseline overhead can be 
measured by invoking the program without arguments. 


Classes: 
Timer 
Functions: 


timeit(string, string) -> float 
repeat(string, string) 一 > list 
default timer() -> float 


使 用 dir O PR Zu] I A H S IZ BEER E X. p Wpit AE E PR ACRI AS : 
>>> dir(timeit) 
['Time', ' all ', ' builtins ', ' cached ' ' doc ',' file ', ' loader ', ' name ', 


' package ', ' spec ', ' template func', 'default number', 'default repeat', 'default timer', ' 


dummy src name', 'gc', 'itertools', 'main', 'reindent', 'repeat', 'sys', 'template', 'time', 'timeit'] 


但 并 不 是 所 有 这 些 名 字 对 我 们 都 有 用 ,所 以 要 过 滤 掉 一 些 不 需要 的 东西 。 你 可 能 留意 到 
KEAS all 属性 ,事实 是 它 就 是 帮助 我 们 完成 这 么 一 个 过 滤 的 操作 : 

>>> timeit. all 

['Timer', 'timeit', 'repeat', 'default timer'] 

timeit RHH SK HA — ARAZA e AERAR y Hf E TELA all Jm PESE n] LÀ 
直接 获得 可 供 调用 接口 的 信息 。 

这 里 有 两 点 需要 注意 : 第 一 ,不 是 所 有 的 模块 都 有 __all_ 属 性 ; 第 二 ,如 果 一 个 模块 设置 
了 _all_ 属性 ,那么 使 用 "from timeit import. * ”这 样 的 形式 导入 命名 空间 ,就 只 有 _ all Jm 
性 这 个 列表 里 边 的 名 字 才 会 被 导入 ,其 他 的 名 字 不 受 影响 : 
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>>> Timer 

«class 'timeit. Timer'> 

>>> gc 

Traceback (most recent call last): 

File "< pyshell# 14>", line 1, in < module» 
gc 

NameError: name 'gc'is not defined 

但 如 果 没 有 设置 _all 属性 的 话 ,用 "from 模块 名 import * ”就 会 把 所 有 不 以 下 划 线 开 
头 的 名 字 都 导入 到 当前 的 命名 空间 。 所 以 ,建议 在 编写 模块 的 时 候 , 将 对 外 提供 的 接口 函数 和 
类 都 设置 到 al 属性 这 个 列表 里 。 

男 外 还 有 一 个 叫 作 __file__ 的 属性 ,这 个 属性 指明 了 该 模块 的 源 代码 位 置 : 

>>> import timeit 


>>> timeit. file 
'C:\\Python34\\lib\\timeit. py' 


最 后 ,还 有 一 道 东 手 铜 , 也 是 我 们 常用 的 一 一 使 用 helpO PRI: 


>>> help(timeit) 
ECKE UEM 


XT timeit 模块 ,由 于 这 个 模块 实在 太 有 用 了 (经 常用 来 实现 代码 计时 ) ,所 以 作者 把 对 应 
的 文档 做 了 下 翻译 ,大 家 可 以 收藏 一 下 ,今后 你 肯定 会 用 上 的 (http://bbs. fishc. com/thread- 
55593-1-1. html), 


e 156 。 


14.1 入 门 


本 章 教 大 家 写 一 只 属于 你 自己 的 网 络 爬 虫 。 那 什么 是 网 络 爬 虫 呢 ? 网 络 爬 虫 ， 又 称 为 网 
页 蜂 蛛 (WebSpider) ,非常 形象 的 一 个 名 字 。 如 果 你 把 整个 互联 网 想象 成 类 似 于 蜂 蛛 网 一 样 
的 构造 ,那么 这 只 息 虫 ,就 是 要 在 上 边 候 来 息 去 ,以 便 捕 获 我 们 需要 的 资源 。 

我 们 之 所 以 能 够 通过 百度 或 谷歌 这 样 的 搜索 引擎 检索 到 你 的 网 页 , 徘 的 就 是 他 们 大 量 的 
候 虫 每 天 在 互联 网 上 扑 来 息 去 ,对 网 页 中 的 每 个 关键 词 进行 索引 ,建立 索引 数据 库 。 在 经 过 复 
杂 的 算法 进行 排序 后 ,这 些 结果 将 按照 与 搜索 关键 词 的 相关 度 高 低 , 依 次 排列 。 

当然 ,编写 一 个 搜索 引擎 ,是 一 件 非常 艰 和 闸 的 事情 ……… 但 千里 之 行 , 始 于 足下 ! 先 从 编写 
一 个 小 息 虫 代码 开始 ,然后 不 断 地 来 改进 它 。 

使 用 Python 编写 爬虫 代码 ,要 解决 的 第 一 个 问题 是 : Python 如 何 访问 互联 网 ? 

好 现实 的 一 个 问题 …… 

好 在 iie 为 此 准备 好 了 “电池 ”: urllib 模块 。 

事实 上 这 个 urllib 是 URL 和 lib 两 个 单词 共同 构成 的 : URL. -， 大 家 都 知道 ， 就 是 平时 说 的 
网 页 的 地 址 ; lib 是 library E) WAS. Ba C 工作 室 的 首页 , URL 的 地 址 就 是 http:// 
www. fishc. com, 

URL 的 一 般 格 式 为 (市 方 括号 [的 为 可 选项 ) : protocol: / /hostnamel| port |/ path/[ ; parameters | 
[? query | € fragment, 

URL 由 三 部 分 组 成 : 

CD 协议 ,和 常见 的 有 http、https、ftp,file( 访 问 本 地 文件 夹 )、ed2k( 电 驴 的 专用 链接 ) 等 等 。 

(2) 存放 资源 的 服务 器 的 域名 系统 (DNS) 主 机 名 或 IP 地 址 (有 时 候 要 包含 端口 号 ,各 种 
传输 协议 都 有 默认 的 端口 号 ,如 http 的 默认 端口 为 80) 。 

(3) 主机 资源 的 具体 地 址 ,如 目录 和 文件 名 等 。 

第 1 部 分 和 第 2 部 分 用 ”:// 符号 隅 开 ， 

第 2 部 分 和 第 3 部 分 用 /2 符号 隅 开 。 

第 1 部 分 和 第 2 部 分 是 不 可 缺少 的 ,第 3 部 分 有 时 可 以 省 略 。 

说 完 URL ,可 以 来 谈 这 个 urllib 模块 了 。Python3 其 实 对 这 个 模块 做 了 挺 大 的 改动 ,以 前 
有 一 个 urllib 模块 还 有 一 个 urllib2 模块 (对 urllib 的 补充 ) , 乱 得 很 ……: Python3 干脆 将 它们 
合并 在 了 一 起 ,统一 叫 urllib。 这 其 实 也 不 是 一 个 模块 , 它 是 一 个 包 (package)。 
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打开 参考 文档 看 一 下 ,如 图 14-1 所 示 。 


21.5. urllib — URL handling modules 


urllib is a package that collects several modules for working with URLs: 


urllib. request for opening and reading URLs 

urllib. error containing the exceptions raised by urllib. request 
urllib. parse for parsing URLs 

urllib. robotparser for parsing robots. txt files 


图 14-1 urllib 模块 


其 实 urllib 是 一 个 包 ,里 边 总 共有 四 个 模块 。 第 一 个 模块 是 最 复杂 的 也 是 最 重要 的 ,因为 
它 包 含 了 对 服务 需 请 求 的 发 出 、 跳 转 、 代理 和 安全 等 各 个 方面 。 
先 来 体验 一 下 吧 ,通过 urllib. request. urlopen() 图 数 就 可 以 访问 网 页 了 : 


>>> import urllib. request 

>>> response = urllib.request. urlopen("http://www. fishc. com") 

>>> html = response. read() 

>>> print(html) 

b'«! DOCTYPE html PUBLIC " - //W3C//DTD XHTML 1.0 

Strict//EN" Mn ME" http: / /www. w3. org/ TR/ xhtm11 /DTD/xhtmll - strict. dtd">\r\n\r\n<! -— \r\n(c) 2011 
\xc4\xbdubom\xc3\xadr Krupa, CC BY - ND 3. 0\r\n -->\t\r\n\r\n< html 

xmlns = "http://www. w3. org/1999/xhtml">\r\n\t < head >\r\n\t\t < meta 


细心 的 读者 可 能 会 发 现 , 这 跟 在 浏览 需 上 使 用 "审查 元 素 ? 功 能 看 到 的 内 容 不 太一 样 ? 如 
图 14-2 所 示 。 


V GI &cIfem-eemE x VW — D x 


Q O Elements Console Sources Network Timeline » A1 


DOCTYPE html PUBLIC W3C//DTD XHTML 1.0 Strict//E 
"http Www .MÀ.org htnl1/DTD/xhtml1-strict.dtd 


| (9 2011 Lubomír Krupa, CC BY-ND 3.0 
-> 
S Q | m— http://www. w3. 0ng/1999/xhtml"» 
3 perimit | LA 
EUROS chead » 
1 «meta http-equiv-"content-type  content- text/html; charset-Utf-8 > 

«link rel="stylesheet” type="text/css” href- lib/style.css > 
《seript type- text/javascript src- lib/jaquery-1.6.1.min.js ></script> 
<script type" ns src-"lib/ 


* Land fa jauary.animation.easing.js ^«/script? 
fa «script type-"text/javascript" snrc-"lib/ 
jauery.mousewhee] min. j5" ^ «/script? 
— 


«script type-"text/javascript" src-"source.]s"» </script> 
«script type-"text/javascript" src-"lib/script.js"»«/script» 
ctitle»xfCTIE£€- RUIT ERES AICE BH CARE ieszdt 
F |Delphi €x | X 5 BE; | Linux & Pe / title: 
«meta name-"keywonrds" content= eM e pnm es 
MART Delphi RAAR Linuxsit? BARRER 
«meta name-"description" content= O MERN TE EAMAN, 主要 涉 
I CERIS, WinME Delphi NAAF, Linux 魏 学 ， Es 
» dpa ipei hib 
kb cstyle»..c/style» 
b cstyle».c/style» 


w Fm 


图 14-2 审查 元 素 


H Python f& tf Z& V3 ZEXÉ utf-8 编码 的 bytes 对 象 ( 注 意 : 上 边 打 印 的 字符 串 前 边 
有 个 b, 表 示 这 是 一 个 bytes 对 象 , 可 以 理解 为 字符 串 的 每 个 字符 用 于 存放 一 个 字 节 的 二 进 制 
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€ 14z 论 一 只 代 虫 的 自我 修养 |n 
数据 ) ,要 还 原 为 带 中 文 的 html 代码 ,需要 对 其 进行 解码 ,将 它 变 成 Unicode 编码 : 


>>> html = html. decode("utf - 8") 
>>> print(html) 


«title»fü C 工作 室 -免费 编程 视频 教学 | 编程 技术 交流 1C 语言 教学 | 汇编 教学 |win32 教学 | 
Delphi 教学 | 加 密 与 解密 |Linux 教学 </title> 


什么 是 编码 


事实 上 计算 机 只 认识 0 和 1, 然 而 却 可 以 通过 计算 机 来 显示 文本 ,这 就 是 靠 编 码 实现 的 。 
编码 其 实 就 是 约定 的 一 个 协议 ,比如 ASCH 编码 约定 了 大 写字 母 A 对 应 十 进 制 数 65 ,那么 在 
读 取 一 个 字符 串 的 时 候 , 看 到 65 ,计算 机 就 知道 这 是 大 与 字母 A 的 意思 。 

由 于 计算 机 是 美国 人 发 明 的 ,所 以 这 个 ASCII 编码 设计 时 只 采用 1 个 字 节 存储 ,包含 了 
大 小 写 英 文字 母 .数字 和 一 些 符 号 。 但 是 计算 机 在 全 世界 普及 之 后 ,ASCII 编码 就 成 了 一 个 瓶 
颈 ,因为 1 个 字 节 是 完全 不 足以 表示 各 国语 言 的 。 

大 家 都 知道 英文 只 用 26 个 字母 就 可 以 组 成 不 同 的 单词 ,而 汉字 光 笛 用 字 就 有 好 几 千 个 ， 
至 少 需要 2 个 字 节 才 足 以 存放 ,所 以 后 来 中 国 制定 了 GB 2312 编码 ,用 于 对 汉字 进行 编码 。 

然后 日 本 为 目 己 的 文字 制定 了 Shift_JIS 编码 , 围 国 为 目 己 的 文字 制定 了 Euc-kr 编码 ,一 
时 之 间 ,各 国都 制定 了 上 自己 的 标准 。 不 难 想象 ,不 同 的 标准 放 在 一 起 ,就 难免 出 现 冲 突 。 这 也 
正 是 为 什么 最 初 的 在 计算 机 上 总 是 容易 看 到 乱码 的 现象 。 

为 了 解决 这 个 问题 ,Unicode 编码 应 运 而 生 。Unicode 组 织 的 想法 最 初 也 很 简单 : 创建 一 
个 足够 大 的 编码 ,将 所 有 国家 的 编码 都 加 进来 ,进行 统一 标准 。 

没 错 ,这 样 问题 就 解决 了 。 但 新 的 问题 也 出 现 了 : 如 果 你 写 的 文本 只 包含 英文 和 数字 , 那 

么 用 Unicode 编码 就 显得 特别 浪费 存储 空间 (用 ASCH 编码 只 占用 一 半 的 存储 空间 )。 所 以 

本 大 能 省 一 点 是 一 点 的 精神 ,Unicode 还 创造 出 了 多 种 实现 方式 。 

比如 常用 的 UTF-8 编码 就 是 Unicode 的 一 种 实现 方式 , 它 是 可 变 长 编码 。 人 简单 地 说 ,就 
是 当 文 本 是 ASCI 编码 的 字符 时 , 它 用 1 个 字 节 存放 ; 而 当 文 本 是 其 他 Unicode 字符 的 情况 ， 
它 将 按 一 定 算 法 转换 ,每 个 字符 使 用 1 一 3 个 字 节 存放 。 这 样 便 实现 了 有 效 节 省 空间 的 目的 
QE: 有 关 编 码 的 详细 介绍 ,可 以 参考 http://bbs. fishc. com/thread-46797-1-1. html). 


14.2 实战 


14.2.1 下 载 一 只 猫 


第 一 个 例子 是 “下 载 一 只 猫 ”, 这 是 codecademy 上 边 的 一 个 例子 。 我 们 说 林子 大 了 ,什么 
乌 都 有 。 互 联网 这 么 大 ,想当然 也 有 各 种 不 同 特色 的 网 站 。 第 一 个 例子 需要 访问 http:// 
placekitten. com 这 个 网 站 ,这 是 一 个 为 “ 猫 奴 ” 量 号 定制 的 站 点 。 

在 网 址 后 边 直 接 附 上 宽度 和 高 度 ,就 可 以 得 到 一 张 对 应 的 猫 的 图 片 , 例 如 访问 的 地 址 是 
http://placekitten. com/g/200/300, 那 么 将 得 到 一 张 宽度 为 200 像素 、 高 度 为 300 像素 的 图 
片 , 如 图 14-3 所 示 。 
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€ 3 Q WG placekittencom/9/200/300- 


14-3 ”获得 噶 星 人 的 照片 


获取 的 图 片 都 是 .jpg 格式 的 ,你 可 以 使 用 右键 快捷 菜单 中 的 “图 片 男 存 为 ”命令 将 其 直接 
保存 到 本 地 。 
现在 用 Python 来 实现 刚才 的 操作 : 


# pl4 1.py 
import urllib. request 


response = urllib.request.urlopen("http://placekitten. com/g/200/300") 

cat img = response. read() 

with open('cat 200 300.jpg', 'wb') as f: 

f.write(cat img) 

快 看 ,代码 所 在 的 文件 夹 中 是 不 是 出 现 了 cat. 200. 300. jpg 这 张 图 片 ? 

不 错 , 既 然 程 序 可 以 顺利 执行 , 那 接 下 来 快速 地 解读 一 下 代码 ,避免 大 家 有 些 地 方 理解 不 到 
位 : 首先 ,urlopen 的 url 参数 既 可 以 是 一 个 字符 串 也 可 以 是 Request 对 象 , 如 果 你 传人 一 个 字符 
串 ,那么 Python 是 会 默认 先 帮 你 把 目标 字符 串 转换 成 Request H Z ,然后 再 传 给 urlopen PRA, 

因此 ,代码 也 可 以 这 么 写 : 


req = urllib. requset. Requset("http://placekitten. com/g/200/300") 
response = urllib.request. urlopen(req) 


然后 ,urlopen 实际 上 返回 的 是 一 个 类 文件 对 象 , 因 此 你 可 以 用 read() 方 法 来 读 取 内 容 。 
除 此 之 外 ,文档 还 告诉 你 以 下 三 个 函数 可 能 以 后 会 用 到 : 

e geturl() 一 一 返回 请 求 的 url. 

。 info() 一 一 返回 一 个 httplib. HTTPMessage 对 象 ,包含 远程 服务 器 返回 的 头 信 息 。 

e getcode() 一 一 返回 HTTP 状态 人 码 。 
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14.2.2 翻译 文本 


第 二 个 例子 要 求 利 用 有 道 词典 来 翻译 文本 。 
首先 来 到 官网 (http://www. youdao. com) , 单 击 “有 道 翻 译 ” 图 标 (http://fanyi. youdao. 
com) ,出 现 如 图 14-4 所 示 的 界面 。 


EEA: oW AAL me x D RERNE @ Uis 


| love FishC.com! 我 受 FishC.com ! 


自动 榨 测 语言 ~ 


14-4 有 道 翻译 


首先 使 用 浏览 需 的 “审查 元 素 ” 功 能 (现在 基本 上 所 有 的 浏览 器 都 目 带 有 这 么 一 个 调试 插 
件 ) ,这 里 使 用 的 是 谷歌 浏览 需 , 其 他 浏览 硕 的 用 法 也 善 不 多 。 在 浏览 希 中 右 击 ,选择 "审查 元 
素 ” 命 令 ,切换 到 Network 窗口 ,如 图 14-5 所 示 。 


| love FishC.com! 名 


[X 0 Elements Console sce ema oven Profiles Resources Security Audits Adblock Plus 


检测 到 |: 英语 » 中 文 


i 一 
© O me y |View E = | DPreservelog B Disable cache | No throttling v 
[Filter CJ Hide data URLs Q| xhg js Css img Media Font Doc WS Other 
| 50 ms 100 ms 150 ms 200 ms 250 ms 300 ms 350 ms 400 ms 450 ms 500 


14-5 “审查 元 素 ” 的 使 用 (一 ) 


这 时 候 单 击 页 面 中 的 “自动 翻译 ?按钮 ,就 会 发 现 拦截 到 许多 文件 ,这 些 文件 就 是 浏览 器 和 
客户 端的 通信 内 容 , 如 图 14-6 所 示 。 

在 客户 端 和 服务 器 之 间 进 行 请 求 -响应 时 ,两 种 最 常 被 用 到 的 方法 是 GET 和 POST, if 
常 ,GET 是 从 指定 的 服务 器 请 求 数据 。 而 POST 是 向 指定 的 服务 器 提交 要 被 处 理 的 数据 ( 当 
然 , 这 不 是 绝对 的 ,因为 在 现实 情况 中 ,GET 也 用 来 提交 数据 给 服务 器 ) 。 

那 刚 才 的 动作 是 提交 数据 ,对 吧 ? 所 以 一 眼看 到 POST, 赶 紧 打 开 来 看 看 ,如 图 14-7 
所 示 o 
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[x g | Elements Console Sources Network Timeline Profiles Resources Security Audits Adblock Plus 


0 G me Y Viw: :2 = | 国 Preservelog B Disable cache | No throttling M 
© Hide data URLs ff) | xhg iS css img Media Font Doc Ws Other 
| 50 ms 100 ms 150 ms 200 ms 250 ms 300 ms 350 ms 400 ms 450 ms 
Name Status T Initiat 
Path Text ype nitiator 
Ly translate?smartresult- dict&smartresult- rule&smartresu.. 200 m fanyi.js:3 
OK Script 
rlog.php? npid-fanyiweb& ncat-event& ncoo- 118941... 
(pending) Other 
rlogs.youdao.com 
request.s?req- http?63A9c2F9c2 Ffanytr.youdao.com?962F96.. (failed) r— fanyıjs:1 
J impservice.dictapp.youdao.com/imp net:ERR_BLOCK.., Scnpt 
request.s?req- http?53A962F9&2 Ffanyi.youdao.com?62F96... | (failed) d ] fanyi.js:1 
J impservice.dictapp.youdao.com/imp net:ERR BLOCK... Script 
m data:image/png;base... 200 data:text/html,chromewebdat... 
OK png Parser 


14-6 “审查 元 素 ” 的 使 用 (二 ) 


Q D) Elements |Network| Sources Timeline Profiles Resources Audits Console 
© O Y View IÆ 三 Options: D) Preserve log ® Disable cache 


D) se Seipe sie Images Meda Fonts Documents W 


200 ms 250 ms 300 ms 350 ms 400 ms 450 ms 


Name Method Type Initiator 


[] translate?smartresukt=dict&smartresult=rule&smartres. (Č POST ~) xhr 


lä rlog.php? npidzfanyrweb&, ncatzevent& nssnzNULL&.. GET text/html 

E] request.s?reqzhttp953A962 F962 Ffanyi.youdao.cam962 F & ... document 

E] request.s?req - http?53A962 F9e2 Ffanyi.youdao.com?e2 F&... document 

H image?id=-81146293189818723533&product=adpublish jpeg ireg- 
日 youdao-ead-union-logo-y-red.png png request.s?regzhttp963A962F ... 
E] cacjs script 

| ] cf.gif?sourcez EADD 

8 requests | 38.5 KB transferred 


图 14-7 “审查 元 素 ” 的 使 用 (三 ) 


单 击 “translate? smartresult = dicté-smartresult = rule&smartres…” 选 项 ,如 14-8 


所 示 。 


X Header - Response Cookies Timing 


L_ translate?smartresult- dict&smartresult-rule&smart; ¥ (type: "EN22H CN", errorCode: 0, elapsedTime: 8,..) 
li riog.php? npidzfanyiweb&. ncat-event& nssnzNUL.. elapsedTime: 8 


E : errorCode: 8 
E requestsTreq=htipX3A%2P%2Ffanyiyoudao.com %2... > translateResult: [[(sre: ^I love FishC.com!^, tgt: “我 爱 FishC.com !7]]] 


|] request.s?req-http363A962F992 Ffanyi.youdao.com?92... type: "EN2ZH CN" 


口 image?id--81146295189818723538&product- adpubl... 
| *] youdao-ead-union-logo-y-red.png 
L] es 


L] cf.gif?saurce- EADD 


8 requests | 38.5 KB transferred 


图 14-8 “审查 元 素 ” 的 使 用 (四 ) 


e 162 œ 


gl4a 论 一 只 民 虫 的 自我 修养 m 


运气 很 好 ,一 下 子 就 找到 了 ,这 正 是 我 们 需要 的 内 容 ! 选择 Headers 选项 卡 ,如 图 14-9 
所 示 o 


Preview Response Cookies Timing 


| Y Gencral 
E rlog.php?. npidefanyiweb&, ncateevent&, nssns NUL.. Remote Address: 61.135.217.77: 88 
E] roquoct.«?roq- http963A942*9e2 Ffanyi.youdao.com?92.... Request URL: http T, !tanyi .youdaa. com/translate?smartresultedict&smanrtresultezrule&smart nresulteugc&sesstonFnomenull 


Request Method: POST 
Status Code: ® 200 OK 
.] cacjs Y Response Headers view source 
| ef.gif?source" EADD Connection: keep-alive 
| | image?2idz -7796126589287044412&product- adpubl.. Content-Encoding: gzip 
Content- — 1 zh- CN 
Content-Type: aipplication/json;charset-utf.-8 
Date: Thu, 11 Jun 2015 12:33: 37 GMT 
Server. ng dn 
Transfer-Éncoding: chunked 
Vary: Accept-Encoding 
Y Request Headers view source 
Accept: application/jcon, toxt/javacscnipt, */*; q-0.81 
Accept-Encoding: gzip, deflate 
Accept-Language: zh-CN,zh;ao-8.8 
Connection: keep- alive 
Content-Length; 128 
Content-Type: application/x-www-form-urlencoded; charset=UTF-6 


14-9 “审查 元 素 ” 的 使 用 (五 ) 


HTTP 是 基于 请 求 - 啊 应 的 模式 的 ,客户 端 发 出 的 请 求 叫 Request. 服务 端的 啊 应 叫 
Response。 下 面 针 对 一 些 关 键 名 词 ,给 大 家 做 下 注释 : 


Remote Address: 61.135.218.44:80 

# 服务 器 ip 地 址 和 端口 

Request URL: http://fanyi. youdao. com/translate? smartresult = dict&smartresult = rule&ssmartresul = 
ugc&sessionFrom = http://www. youdao. com/ 


# 请 求 的 链接 地 址 
Request Method: POST 


# 请 求 的 方法 ,这 里 是 POST 
Status Code: 200 OK 


# 状态 码 ,200 表示 正常 响应 


Request Headers 是 客户 端 发 送 请 求 的 Headers, 这 个 常常 被 服务 端 用 来 判断 是 否 来 自 
“ 非 人 类 ”的 访问 。 什 么 意思 呢 ? 例如 写 个 Python 代码 ,然后 用 这 个 代码 批量 访问 网 站 的 数 
据 , 这 样 服务 器 压力 就 会 增 大 ,所 以 一 般 服务 器 不 欢迎 “ 非 人 类 ”的 访问 。 

一 般 是 通过 这 个 User-Agent 来 识别 ,普通 浏览 需 会 通过 该 内 容 回访 问 网 站 提供 你 所 使 用 
的 浏览 器 类 型 .操作 系统 .浏览 器 内 核 等 信息 的 标识 : 


| | request.s?req=http%3A%2F%2Ffanyi youdao.com%2... 


"| youdao-ead-union-logo-y-red.png 


User - Agent: 
Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0. 2171.65 
Safari/537.36 


而 使 用 Python 访问 的 话 ,User-Agent 会 被 定义 为 Python-urllib/3. 4, 

所 以 检查 这 个 就 可 以 查 到 请 求 是 来 目 正 稼 的 浏览 硕 单 击 还 是 “ 非 人 类 ?的 访问 。 当 然 , 如 
果 服 务 器 以 为 这 样 就 能 阻挡 我 们 前 进 的 脚步 , 那 它 就 太 天 真 了 了 。 这 个 User-Agent 其 实 是 可 以 
自 定义 的 ,后 边 再 给 大 家 介绍 。 

除 此 之 外 不 难 发 现 , 下 边 有 一 个 Form Data, 这 个 就 是 POST 提交 的 内 容 ( 大 家 看 ,里 边 不 
正 有 “I love FishC. com!” W). 

最 后 一 个 问题 , 那 如 何 用 Python 提交 POST 表单 呢 ? 看 文档 ,如 图 14-10 所 示 。 

这 里 说 得 很 仔细 了: urlopen KAA —A data 参数 ,如果 给 这 个 参数 赋值 ,那么 HTTP 的 
请 求 就 是 使 用 POST 方式 ; 如 果 data 的 值 是 NULL ,也 就 是 默认 值 ,那么 HTTP 的 请 求 就 是 
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urllib. request. urlopen(uri, data=None, [timeout, ]*, cafile=None, 
capath-None, cadefault-False, context=None) 
Open the URL url, which can be either a string or a Reauest object. 


data must be a bytes object specifying additional data to be sent to the 
server, or None if no such data is needed. data may also be an iterable 
object and in that case Content-Length value must be specified in the 
headers. Currently HTTP requests are the only ones that use data; the 
HTTP request will be a POST instead of a GET when the data parameter 
is provided. 


data should be a buffer in the standard application/x-www-form- 
urlencoded format. The urllib parse uriencode() function takes a 
mapping or sequence of 2-tuples and returns a string in this format. It 
should be encoded to bytes before being used as the data parameter. The 
charset parameter in Content-Type header may be used to specify the 
encoding. If charset parameter is not sent with the Content-Type header, 
the server following the HTTP 1.1 recommendation may assume that the 
data is encoded in |SO-8859-1 encoding. It is advisable to use charset 
parameter with encoding used in Content-Type header with the Request. v 


14-10  urllib. request. urlopen O E Zz A d 


使 用 GET 方式 。 这 里 还 告诉 我 们 了 ,这 个 data 参数 的 值 必 须 符 合 这 个 application/ x»-www- 
form-urlencoded 的 格式 。 然 后 还 不 大 其 烦 地 告诉 我 们 要 用 urllib. parse. urlencode() 将 字符 
串 转 换 为 这 个 格式 。 

有 了 这 两 点 知识 其 实 就 够 了 ,来 尝试 写 代码 : 


# pl4 2.py 
import urllib. request 
import urllib. parse 


url - "http://fanyi. youdao. com/translate? smartresult - dict&smartresult - rule&smartresult - 
ugc&sessionFrom = http://www. youdao. com/" 

data = () 

data['type'] = 'AUTO' 

data['i'] = 'I love FishC. con! ' 

data[ 'doctype'] = 'json' 

data[ 'xmlVersion'] = '1.6' 

data['keyfrom'] = 'fanyi.web' 

data['ue'] = 'UTF-8' 

data['typoResult'] = 'true' 

data = urllib. parse. urlencode(data). encode( 'utf - 8) 
response - urllib.request.urlopen(url, data) 

html = response. read(). decode( 'utf - 8") 

print(html) 


>>> 


("type":"EN2ZH CN","errorCode":0,"elapsedTime":2,"translateResult":[[("src":"I love FishC. 
com! ","tgt":"j$£ X FishC.com ! ")]]) 
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字符 串 在 Python 内 部 的 表示 是 Unicode 编码 , 因此 ,在 做 编码 转换 时 ,通常 需要 以 
Unicode 作为 中 间 编 码 , 即 先 将 返回 的 bytes 对 象 的 数据 解码 (decode) 成 Unicode. 再 从 
Unicode 编码 (encode) 成 男 一 种 编码 。 

有 关 编 码 的 问题 探讨 ,大 家 还 可 以 参考 以 下 这 篇 文章 ,相信 会 使 你 受益 菲 浅 的 : Python 
编码 问题 的 解决 方案 总 结 Chttp://bbs. fishc. com/thread-56452-1-1. html). 

数据 是 得 到 了 ,但 是 这 样 显示 未 免 也 太 丑 了 吧 ! 那 怎 么 办 呢 ? 这 是 一 个 字符 串 ,我 们 可 以 
用 查找 字符 串 的 方式 把 需要 的 内 容 给 显示 出 来 。 但 我 们 不 会 这 么 做 ,因为 这 也 太 被 动 了 了 .……… 

这 其 实 是 一 个 JSON 格式 的 字符 串 (JSON 是 一 种 轻 量 级 的 数据 交换 格式 ,说 白 了 这 里 就 
是 用 字符 串 把 Python 的 数据 结构 封装 起 来 ) ,所 以 只 需要 解析 这 个 JSON 格式 的 字符 串 即 可 : 


>>> import json 

>>> json. loads(html) 

('translateResult': [[('tgt': 'R Æ FishC. com ! ', 'src': 'I love FishC. con! ')]]], 'type': 'EN2ZH CN', 
'errorCode': 0, 'elapsedTime': 2) 


可 以 看 到 它 已 经 变 成 一 个 字典 了 , 接 下 来 的 事 儿 就 好 办 多 了 ， 


>>> target = json. loads(html) 

>>> type(target) 

«class 'dict'^ 

>>> target[ 'translateResult'][0][0][ 'tgt'] 
' 我 爱 FishC.com !' 


最 后 让 我 们 把 程序 美化 一 下 : 


# pl4 3.py 

import urllib. request 
import urllib. parse 
import json 


content = input(" 请 输入 需要 翻译 的 内 容 : ") 

url = "http://fanyi. youdao. com/translate? smartresult = dict&smartresult = rule&smartresult = 
ugc&sessionFrom = http://www. youdao. com/" 

data = {} 

data['type'] = 'AUTO' 

data['i'] = content 

data[ 'doctype'] = 'json' 

data['xmlVersion'] = '1.6' 

data['keyfrom'] = 'fanyi.web' 

data['ue'] = 'UTF- 8' 

data['typoResult'] = 'true' 

data = urllib.parse.urlencode(data). encode( 'utf ~ 8") 

response = urllib.request.urlopen(url, data) 

html = response. read().decode( 'utf - 8') 

target - json. loads(html) 

print(" 翻 译 结 果 : %s" % (target[ translateResult'][0][0][ 'tgt'])) 


程序 执行 结果 如 下 : 


>>> 


请 输入 需要 翻译 的 内 容 : 小 甲鱼 
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翻译 结果 : The little turtle 


>>> 

这 里 需要 注意 的 是 : 这 样 的 代码 你 还 不 能 应 用 到 现实 的 生产 环境 中 ,因为 服务 天 一 “看 ” 
User-Agent 来 源 是 “ 非 人 类 ”, 它 就 把 你 屏蔽 了 。 或 者 一 看 你 这 IP EA W ix ZA SUR sod 25 
i 


有 些 网 站 不 喜欢 被 程序 访问 ,因此 它们 会 检查 链接 的 来 源 。 如 采访 问 来 源 不 是 正 笛 的 途 
径 ,就 给 你 " 拘 掉 ”。 所 以 为 了 证 我 们 的 爬虫 更 好 地 为 我 们 服务 ,需要 对 代码 进行 一 些 改进 一 一 
隐藏 ,让 它 看 起 来 更 像 是 普通 人 通过 普通 浏览 带 的 正常 点 


14.3.1 修改 User-Agent 


在 文档 中 搜索 User-Agent, 可 以 看 到 urllib. request. Request 部 分 有 关于 设置 User- 
Agent 的 叙述 ,如 图 14-11 所 示 。 


headers should be a dictionary, and will be treated as if &dd header() 
was called with each key and value as arguments. This is often used to 

"spoof' the User-Agent header, which is used by a browser to identify 
itself - some HTTP servers only allow requests coming from common 
browsers as opposed to scripts. For example, Mozilla Firefox may identify 
itself as "Mozilla/5.0 (X11; U; Linux i686)  Gecko/20071127 
Firefox/2. 0. 0. 11^, while ur1lib's default user agent string is "Python- 
urllib/2.6" (on Python 2.6). 


图 14-11 设置 User-Agent 


文档 中 说 得 很 清楚 了 : Request 有 个 headers 参数 ,通过 设置 这 个 参数 ,你 可 以 伪造 成 浏 
VA aU]. ix EXT headers 参数 有 两 种 途径 : 实例 化 Request 对 象 的 时 候 将 headers 参数 传 
进去 和 通过 add header() 方 法 往 Request 对 象 添 加 headers, 

第 一 种 方法 要 求 headers 必须 是 一 个 字典 的 形式 : 


# pl4 4.py 

import urllib. request 
import urllib. parse 
import json 


content = input(" 请 输入 需要 翻译 的 内 容 : ") 

url = "http://fanyi. youdao. com/translate? smartresult = dict&smartresult = rule&smartresult = 
ugc&sessionFrom = http://www. youdao. com/" 

head = {} 

head[ 'Referer'] = 'http://fanyi. youdao. com' 

head['User - Agent'] = 'Mozilla/5. 0 (Macintosh; Intel Mac OS X 10 10 1) AppleWebKit/537. 36 
(KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36X - Requested - With:XMLHttpRequest ' 

data = () 

data['type'] = 'AUTO' 

data['i'] = content 
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data['doctype'] = 'json' 

data['xmlVersion'] = '1.6' 

data[ keyfrom'] = 'fanyi.web' 

data['ue'] = 'UTF-8' 

data[ typoResult'] = 'true' 

data = urllib.parse.urlencode(data). encode( 'utf - 8") 


req = urllib.request.Request(url, data, head) 

response - urllib.request. urlopen(req) 

html = response. read(). decode( 'utf - 8") 

target - json. loads(html) 

print(" 翻 译 结 果 : %s" % (target[ translateResult'][0][0][ 'tgt'])) 
测试 下 是 否 成 功 修改 : 


>>> 

请 输入 需要 翻译 的 内 容 : 爱情 

翻译 结果 : love 

>>> req. headers 

('Referer': 'http://fanyi. youdao.com', 'User  agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10 
10 1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36X - Requested - 
With: XMLHttpRequest ') 


>>> 
还 有 另外 一 种 方法 ,就 是 在 Request 对 象 生 成 之 后 ,用 add_header() 方 法 追加 进去 : 
# pl4-5.py 


import urllib. request 
import urllib. parse 
import json 


content = input(" 请 输入 需要 翻译 的 内 容 : ") 
url = "http://fanyi. youdao. com/translate? smartresult = dict&smartresult = rule&smartresult = 
ugc&sessionFrom = http://www. youdao. com/" 
data = {} 
data['type'] = 'AUTO' 
data['i'] = content 
data['doctype'] = 'json' 
data[ 'xmlVersion'] = '1.6' 
data['keyfrom'] = 'fanyi.web' 
data['ue'] = 'UTF-8' 
data['typoResult'] = 'true' 
data = urllib.parse.urlencode(data). encode( 'utf - 8") 
req - urllib.request.Request(url, data) 
req.add header( Referer', 'http://fanyi. youdao. com') 
req.add header( User - Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10 10 1) AppleWebKit/537.36 
(KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36X - Requested - With:XMLHttpRequest ') 
response - urllib.request. urlopen(req) 
html = response. read().decode( 'utf - 8") 
target - json. loads(html) 
print(" 翻 译 结果 : €s" % (target[ translateResult'][0][0][ '£gt'])) 
测试 下 是 否 成 功 修改 : 


>>> 


请 输入 需要 翻译 的 内 容 : love 
翻译 结果 : 爱 
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>>> req. headers 


('User- agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10 10 1) AppleWebKit/537.36 (KHTML, like 
Gecko) Chrome/39. 0. 2171. 95 Safari/537. 36X - Requested - With: XMLHttpRequest ', 'Referer ': 


'http: //fanyi. youdao. com '] 


>>> 


通过 修改 User-Agent 实现 隐藏 ,可 以 算是 最 简单 的 方法 了 上 。 不 过 如 果 这 是 一 个 用 于 抓 取 
网 页 的 爬虫 (例如 说 批量 下 载 某 些 图 片 .…… ) ,那么 一 个 IP 地 址 在 短 时 间 内 连续 进行 网 页 访 
问 ,很 明显 是 不 符合 普通 人 类 的 行为 标准 的 ,同时 也 会 对 服务 天 造成 不 小 的 压力 。 因 此 服务 需 
只 需要 记录 每 个 IP 的 访问 频率 ,在 单位 时 间 之 内 ,如 果 访 问 频 率 超 过 一 个 国 值 , 便 认 为 该 IP 
地 址 很 可 能 是 爬虫 ,于 是 可 以 返回 一 个 验证 码 页 面 , 要 求 用 户 填写 验证 码 。 如 有 果 是 爬虫 的 话 ， 


当然 不 可 能 填写 验证 码 , 便 可 拒绝 掉 。 


那 怎么 办 呢 ? 那 就 我 们 目前 的 知识 水 平 ,有 两 种 策略 可 供 选择 : 第 一 种 就 是 延迟 提交 的 


时 间 ,还 有 一 种 策略 就 是 使 用 代理 。 
14.3.2 -延迟 提交 数据 


延迟 提交 的 时 间 ,这 个 容易 ,用 time 模块 的 即 可 : 


# pl4 6.py 
import urllib. request 


import urllib. parse 


import json 


import time 


url 


= "http://fanyi. youdao. com/translate? smartresult = dict&smartresult = rule&smartresult = 


ugc&sessionFrom = http://www. youdao. com/" 
while True: 


content = input(' 请 输入 待 翻译 内 容 ( 输 入 "q!" 退 出 程序 ): 7) 
if content == 'g!': 

break 
data = {} 


data[ 'type'] = 'AUTO' 

data['i'] = content 

data['doctype'] = 'json' 

data[ 'xmlVersion'] = '1.6' 

data[ 'keyfrom'] = 'fanyi.web' 

data['ue'] = "UTF-8' 

data[ 'typoResult'] = 'true' 

data = urllib. parse. urlencode(data). encode( 'utf - 8") 
req = urllib.request.Request(url, data) 

req.add header('Referer', 'http://fanyi. youdao. com ') 


req.add header( User - Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10 10 1) AppleWebKit/ 
537.36 (KHIML, like Gecko) Chrome/39.0.2171.95 Safari/537.36X - Requested - With: XMLHttpRequest') 


response = urllib.request. urlopen(req) 
html = response. read().decode( 'utf - 8') 
target = json. loads(html) 


print(" 翻 译 结果 : %s" % (target[ 'translateResult'][0][0][ 'tgt'])) 


time. sleep(5) 


如 果 这 样 做 ,会 使 得 程序 的 工作 效率 降低 。 
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9=3- 使 用 代理 


第 二 个 方案 是 使 用 代理 。 代 理 是 什么 ? 代理 就 是 " 嘿 ,兄弟 ,哥们 访问 这 网 址 有 点 困难 , 帮 
忙 解决 一 下 喘 .” 然 后 就 把 需要 访问 的 网 址 告诉 代理 ,代理 蔡 你 访问 ,然后 把 看 到 的 内 容 都 转发 
给 你 ,这 就 是 代理 的 工作 。 因 此 服务 各 看 到 的 是 代理 的 IP 地 址 ,而 不 是 你 的 IP 地 址 。 

使 用 代理 的 步骤 如 下 : 

(1) proxy support = urllib. request. Proxy Handler()) 

# SR E—^1 xu unge dti ge Ae IC As . ,例如 http. ftp 或 https, 字 由 的 值 就 是 代理 的 
IP 地 址 和 对 应 的 端口 号 。 

(2) opener = urllib. request. build opener(proxy. support) 

# 这 里 大 家 先 要 知道 什么 是 opener? 

# opener 可 以 看 作 是 一 个 私人 定制, 当 使 用 urlopen O ARGIA — A Id 94 HB EST fee «S E 
使 用 默认 的 opener 在 工作 。 

# 而 这 个 opener 是 可 以 定制 的 ,例如 ,给 它 定制 特殊 的 headers ,或 者 给 它 定 制 指定 的 代 
理 IP 

# 所 以 这 里 使 用 build_opener() 函 数 创建 了 一 个 属于 我 们 自己 私人 定制 的 opener 

(3) urllib. request. install openerCopener) 

# 这 里 是 将 定制 好 的 opener Z7 E RAP x de — 55 KS ITI GIA 

# 因为 在 此 之 后 ,你 只 要 使 用 普通 的 urlopen O PR ZI. WE DA XE mil 4f I) opener 3t 17 T. 
作 的 。 

H 如 果 你 不 想 替 换 掉 默认 的 opener, 你 也 可 以 在 每 次 特殊 需要 的 时 候 , 用 opener. openO 
的 方法 来 打开 网 页 。 

举 个 例子 : 搜索 “代理 IP? 字 样 获 得 一 个 免费 的 代理 IP 地 址 (这 里 找到 的 代理 IP 是 : 
211. 138. 121. 38:80) ,通过 访问 http://www. whatismyip. com. tw 可 以 查看 当前 IP. 


# pl4 7.py 
import urllib. request 


url = 'http://www. whatismyip. com. tw/' 

proxy support = urllib.request.ProxyHandler(í http':'211.138.121.38:807]) 
# 接着 创建 一 个 包含 代理 IP 的 opener 

opener = urllib.request.build opener(proxy support) 

# 安装 进 默 认 环境 

urllib.request. install opener(opener) 

# 试 试看 IP 地 址 改 了 没 

response = urllib.request. urlopen(url) 

html = response. read(). decode( 'utf - 8") 

print(html) 


让 程序 跑 起 来 吧 : 


>>> 
< html > 
< head > 
< meta http - equiv = "Content - Type" content = "text/html; charset = utf - 8" /> 
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< meta name = "description" content = "我 的 IP 查 询 "/> 
< meta name = "keywords" content = "# IP, IP 查询 , 查 我 的 IP, 我 的 IP 地址 ,我 的 IP 位 置 , 侦 测 我 
的 IP, 查询 我 的 IP, 查看 我 的 IP, 显示 我 的 IP,what is my IP, whatismyip,my IP address, my IP proxy" /» 
<title > 我 的 IP 位 址 查询 </title> 
</head > 
<body> 
<hl > IP 位 址 </hl > <h2 > 211.138.121.38 </h2 > 


还 可 以 设置 一 个 iplist, 多 填写 几 个 IP 进去 ,然后 每 次 随机 使 用 一 个 IP 来 访问 : 


# pl4 8.py 
import urllib. request 


import random 


url = 'http://www. whatismyip. com. tw/' 
print(" 添 加 代理 IP 地 址 (IP: 端 口号 ), 多 个 IP 地 址 间 用 英文 的 分 号 隔 开 !") 
iplist = input(" 请 开始 输入 : ").split(sep=";") 
while True: 
ip = random. choicel( iplist) 
proxy support = urllib.request.ProxyHandler({'http':ip}) 
opener = urllib.request.build opener(proxy support) 
opener. addheaders = [( User - Agent', 'Mozilla/5. 0 (Macintosh; Intel Mac OS X 10 10 1) 
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36')] 
urllib. request. install opener(opener) 
try: 
print(" 正 在 尝试 使 用 %s 访问 ..." % ip) 
response = urllib.request.urlopen(url) 
except urllib. error. URLError: 
print(" 访 问 出 错 !") 
else: 
print(" 访 问 成 功 !") 
if input(" 请 问 是 否 继续 ?(Y/N)") == 'N': 
break 
让 程序 跑 起 来 吧 : 


>>> 

添加 代理 IP 地 址 (IP: 端 口号 ), 多 个 IP 地 址 间 用 英文 的 分 号 隔 开 ! 
请 开始 输入 : 124.254.57.150:8118;61.184.192.42:80;88.88. 88. 88:88 
正在 尝试 使 用 61.184.192.42:80 访问 .…. 

访问 成 功 ! 

请 问 是 否 继续 ? (Y/N)Y 

正在 尝试 使 用 61.184.192.42:80 W... 

访问 成 功 ! 

请 问 是 否 继 续 ? (Y/N)Y 

正在 尝试 使 用 88. 88. 88. 88:88 ji... 

访问 出 错 ! 

请 问 是 否 继续 ? (Y/N)Y 

正在 尝试 使 用 124. 254.57.150:8118 访问 .…. 

访问 成 功 ! 

请 问 是 否 继续 ? (Y/N)N 


>>> 
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这 一 讲 给 大 家 介绍 一 个 压 箱 底 的 模块 Beautiful Soup 4 ,翻译 过 来 名 字 有 点 诡异 : y 
亮 的 汤 ? 美味 的 鸡汤 ? 好 吧 , 只 要 你 写 出 一 个 普罗 大 众 都 喜欢 的 模块 ,你 管 它 叫 ”Beautiful 
Boy” 大 家 也 是 能 接受 的 …… 

Beautiful Soup 是 一 个 可 以 从 HTML 或 XML 文件 中 提取 数据 的 Python 库 。 它 能 够 通 
过 你 豆 欢 的 转换 一 实现 常规 的 文档 导航 、 查 找 、 修 改 文档 的 操作 。Beautiful Soup S RMR E A 
数 小 时 甚至 数 天 的 工作 时 间 。 

安装 Beautiful Soup 非常 容易 ,打开 命令 行 窗口 (CMD), 输 入 py-3-m pip install BeautifulSoup4 
命令 ,如 图 14-12 Bron 

C: \Users\ £F >py -3 -m pip install BeautifulSoup4 


Collecting BeautifulSoup4 
Downloading beautifulsoup4-4.4.1-py3-none-any.whl (81kB) 


199% | 有 1kB 1. 2"E/ s 
Installing collected packages: BeautifulSoup4 
Successfully installed BeautifulSoup4-4.4.1 


图 14-12 使 用 pip 安装 Beautiful Soup 4 


ORAE YF VA p sy? 基本 的 用 法 可 以 参考 官方 的 快速 入 门 文档 (网 址 https:// 


* 


www. crummy. com/software/BeautifulSoup/bs4/doc. zh/index. html)。 下 面 通 过 几 个 案例 
给 大 家 演示 如 何 将 其 应 用 到 和 候 虫 中 ，。 

案例 一 : 编写 一 个 息 虫 ,和 候 取 百度 百科 “网 络 息 虫 ” 的 词 条 (网 址 http://baike. baidu. 
com/ view/284853. htm) ,并 将 所 有 包含 “view” 关 键 字 的 链接 按 格式 打印 出 来 ,如 图 14-13 
所 示 。 


Python 3.4.3 (v3.4.3:9b73f1c3e601, Feb 24 2015, 22:43:06) [MSC v.1600 32 bit (In 
tel)] on win32 

Type "copyright", "credits" or "license()" for more information. 

»»» ================================ RESTART ================================ 
>>> 

dE -> http://baike.baidu.com/view/10812319.htm 

HEE -> http://baike.baidu.com/view/284853.htm 

FOAF -> http://baike.baidu.com/view/271451.htm 

万 稚 网 -> http://baike.baidu.com/view/7833.htm 

iu -> http://baike.baidu.com/view/2596.htm 

5 EM -> http://baike.baidu.com/view/7833.htm 

网 络 -> http://baike.baidu.com/view/3487.htm 


图 14-13 ERA BE ARH RNK EE” B3 is] 2 


因为 Beautiful Soup 是 用 于 从 HTML 或 XML 文件 中 提取 数据 ,所 以 需要 先 使 用 urllib. 
request 模块 从 指定 网 址 上 先 读 取 HTML 文件 : 


>>> import urllib. request 

>>> from bs4 import BeautifulSoup 

>>> url = "http://baike. baidu. com/view/284853. htm" 
>>> response = urllib.request. urlopen(url) 

>>> html = response. read() 

>>> soup = BeautifulSoup(html, "html.parser") 
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BeautifulSoup(html. "html. parser”) 需要 两 个 参数 : 第 一 参数 是 需要 提取 数据 的 
HTML 或 XML 文件 ,第 二 个 参数 是 指定 解析 需 。 然 后 使 用 find. all (href = re. compile 
(view”)) 方 法 可 以 读 取 所 有 包含 “view” 关 键 字 的 链接 (这 里 使 用 到 正则 表达 式 的 知识 ,在 
14. 5 节 中 会 详细 讲解 ) ,使 用 for 语句 迭代 读 取 : 


>>> import re 

>>> for each in soup. find all(href = re.conmpile("view")): 
print(each. text, " ->",''. join(["http: //baike. baidu. com", V 

each["href"]])) 


锁定 -> http://baike. baidu. com/view/10812319. htm 
NKE -> http://baike. baidu. com/view/284853. htm 
FOAF -> http: //baike. baidu. com/view/271451. htm 
万 维 网 -> http://baike. baidu. com/view/7833. htm 
蠕虫 -> http://baike. baidu. com/view/2596. htm 


将 代码 整合 一 下 ,得 到 以 下 清单 : 


# pl4 91.py 

import urllib. request 

import re 

from bs4 import BeautifulSoup 


def main(): 
url = "http://baike. baidu. com/view/284853. htn" 
response - urllib.request.urlopen(url) 
html = response. read() 
soup = BeautifulSoup(html, "html. parser") 


for each in soup. find all(href = re.compile("view")): 
print(each. text, "—»", ''. join(["http: //baike. baidu. com", V 
each["href"]1)) 


if name  -- " main 
main() 
'UEDULLZTUTTZSAPAWTA ESILIATENLILAUCLILT. 
词 ,可 以 进入 每 一 个 词 条 ,然后 检测 该 词 条 是 否 具有 副标题 (比如 搜索 “猪八戒 ”, 副 标题 就 是 
“(中 国 神话 小 说 (西游 记 ) 的 角色 )”) ,如 果 有 ,请 将 副标题 一 并 打印 出 来 ,如 图 14-14 所 示 。 
ES W | wb 5716 | E$ 4707 
[zhü bà jié] 中 
猪八戒 |( 中 国 神话 小 党 《西游 记 》 的 角色 ) 


猪八戒 是 吴承恩 所 作 《西游 记 》 中 的 角色 。 又 名 猪 刚 营 ， 法 号 悟 能 ， 是 唐僧 的 二 徒弟 ， 会 三 十 六 天 定 变 ， 所 持 武 器 为 制作 座 
多 武器 法 宝 的 太 上 老 君 所 造 ， 玉 皇 大 帝 亲 赐 的 上 宝 沁 金太。 猪八戒 前 世 为 执 尝 八 万 水 军 的 天 河 统 帅 。114 西游 记 中 各 路 神仙 基本 
借鉴 了 正统 道教 神仙 录 ， 由 高 老 庄 一 集 猪 八 牙 扣 及 九天 荡 魔 祖师 可 见 ， 猪 八 戒 的 前 世 天 茵 元 昨 即 是 水 神 天 河 竺 节 。 


图 14-14 百度 百科 “猪八戒 ”的 词 条 
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要 求 程序 实现 如 图 14-15 所 示 。 


Python 3.4.3 (v3.4.3:9b73f1c3e601, Feb 24 2015, 22:43:06) [MSC v.1600 32 bit (Intel)] on 
win32 


Type "copyright", "credits" or "license()" for more information. 


>> 三 三 三 三 三 三 三 三 三 三 三 三 三 三 三 三 三 三 三 三 三 三 三 三 三 三 三 三 三 三 三 三 RESTART zzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzz 

>>> — 
ARAR: MAR 如 果 和 存在 副标题 , 
多 义 词 目录 -> http://baike.baidu.com/view/18812277.htm Ee r? 

义 项 目录 -> http://baike.baidu.com/view/340519.htm 请 将 它们 打印 出 来 


共 5 个 义 项 -> http://baike. baidu. Cr htm?force-1 

日 本 动漫 《最 游记 》 人 物 Cg -> http: //baike.baidu.com/subview/17156/503 
9854.htmitviewPageContent 
歌手 张 羽 伟 专 辑 〈 和 歌手 张 列 伟 专辑 ) -> http://baike.baidu.com/subview/17156/5039855.htmftviewPa 
geContent 

CILHAR AHWR (SLAEN) 人物 设 定 ) -> http://baike.baidu.com/item/XE7X8CXAAXE5X855 
ABXEGX88X92/17330461$viewPageContent 
动画 电影 《西游 记 之 大 圣 归 来 TH 0 游 1 X 
idu. com/item/%E7%8C%AA%E 5%85XABXE5%88X927 a 
锁定 -> http://baike.baidu.com/view/10812319.htm 
吴承恩 M -> http://baike.baidu.com/subview/5787/19006941.htm 
西游 记 ai > p / /baike.baidu.com/view/2583.htm 

Si Ru] SE sis, Cn -> http: //baike.baidu.com/view/541935.htm 
Ef C -» http: / /baike.baidu.com/view/17148.htm 


图 14-15 ” 按 要 求 打 印 词 条 


-> http://baike.ba 


代码 清单 如 下 : 


# pl4 92.py 

import urllib. request 

import urllib. parse 

import re 

from bs4 import BeautifulSoup 


def main(): 
keyword = input(" 请 输入 关键 词 :") 
keyword = urllib. parse. urlencode({"word" :keyword}) 
response = V 
urllib.request.urlopen("http://baike. baidu. com/search/word? % s" % \ 


keyword) 
html = response. read() 
soup = BeautifulSoup(html, "html. parser") 


for each in soup. find all(href = re.compile("view")): 
content = ''.join([each.text]) 
url2 = ''.join(["http://baike. baidu. com", each["href"]]) 
response2 = urllib. request. urlopen(url2) 
html2 = response2. read() 
soup2 = BeautifulSoup(html2, "html. parser") 


if soup2. h2: 
content = ''.join([content, soup2. h2. text ]) 
content = ''.join([content, " -> ", ur12]) 
print(content) 
if name  -- " main " 
main() 
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44.5 正则 表达 式 
mn 


a 


那么 对 于 字符 串 查 找 ,我 想 你 应 该 已 经 是 深恶痛绝 了 ……… 

不 难 发 现 , 下 载 一 个 网 页 是 容易 的 ,但 是 要 在 网 页 中 找到 你 需要 的 内 容 , 那 是 困难 的 ! 你 
发 现 字符 串 查 找 并 不 是 那么 简单 ,并 不 是 直接 使 用 find() 方 法 就 能 找到 字符 串 位 置 就 可 以 了 。 

通过 前 面 的 学 习 , 你 肯定 尝试 过 写 一 个 脚本 来 自动 获取 最 新 的 代理 IP. 地 址 ,但 是 你 肯定 
也 遇 到 了 字符 串 查 找 上 的 困难 。 好 , 那 现在 来 重 现 一 下 大 家 可 能 遇 到 的 困难 : 

目标 URL: http://cn-proxy. com/ , 

首先 踩点 ,如 图 14-16 所 示 。 


¥ cdiv class-"table-container"» 
VY <table class-"sortable"» 
* cthead»..«/thead» 
> «tfoot»..«/tfoot» 
Y «tbody» 

Y «tr» 
«td»120.203.149.163«/td» 
«td»8118« /td» 

«tdilf 高 州 </tdy 
b «td»..«/td» 

«td»2015-06-12 14:51:28«/td» 
«/tr» 

b <try..</tr> 

b ctr»..«/tnr» 

v etr» 
«td»218.89.170.114«/td» 
«td»8888« /td> 
<td> 四川 | EH 1t«/td» 

= «td»..«/td» 
«td»2015-06-12 14:51:28«/td» 
</tr> 


图 14-16 ”踩点 


读者 朋友 可 能 发 现 这 回 很 难 定 位 到 IP 以 及 对 应 端口 的 位 置 了 。 因 为 对 于 这 个 网 页 似乎 
找 不 到 “唯一 ”的 特征 。 看 来 看 去 只 有 class 王 "sortable" 人 似乎 是 两 个 ip 表格 唯一 的 “特性 ”, 因 
此 你 写 了 段 代 码 , 先 搜索 class 二 "sortable" 关 键 字 ,然后 再 往 下 找到 第 六 个 二 td 二 标签 ,总 算 
是 成 功 地 定位 到 第 一 个 IP 地 址 ……… 

这 样 写 代码 不 仅 费劲 ,而 且 难 看 ,还 不 具备 通用 性 。 更 惨 的 是 ,万 一 站 长 哪 天 心血 来 潮 改 
了 一 下 网 页 代码 ,你 更 是 心 塞 啊 ! 这 时 候 你 就 会 琢磨 ,可 不 可 以 按照 我 需要 的 内 容 特 征 进 行 查 
找 呢 ? 也 就 是 说 ,比如 我 要 找 的 是 IP 地 址 , 那 IP 地址 的 特征 就 是 有 四 段 数 字 组 成 ,每 段 数字 
的 范围 是 0— 255 ,分 别 由 三 个 点 号 (. ) 隅 开 。 

没 错 ,我 们 现在 能 够 想到 的 ,计算 机 的 老 前 非 们 也 已 经 想到 了 ,并 且 帮 我 们 设计 出 了 非常 
优秀 的 解决 方案 。 就 是 我 们 今天 要 讲 的 是 正则 表达 式 。 下 面 小 甲鱼 就 教 大 家 使 用 正则 表达 式 
来 匹配 IP 地 址 。 

关于 正则 表达 式 , 有 一 个 非常 经 典 的 美式 笑话 一 一 有 些 人 面临 一 个 问题 的 时 候 会 想 :“ 我 
知道 ,可 以 使 用 正则 表达 式 来 解决 这 个 问题 ”于 是 ,现在 他 就 有 两 个 问题 了 。 有 些 读者 朋友 可 
能 没 懂 , 意 思 就 是 使 用 正则 表达 式 ,本身 就 是 一 个 难题 ，。 
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没 错 ,正则 表达 式 的 确 很 难 学 ,但 却 非常 有 用 。 这 人 么 说 吧 ,在 编写 处 理 字 符 串 的 程序 或 网 
页 时 ,经 常会 有 查找 符合 茶 些 复 淋 规则 的 字符 串 的 需要 。 用 Python 目 市 的 字符 串 方 法 ,一 定 
会 让 你 恼羞成怒 。 这 时 候 , 如 有 果 你 懂得 正则 表达 式 , 你 会 发 现 这 真是 灵丹妙药 ,因为 正则 表达 
式 就 是 用 于 描述 这 些 复杂 规则 的 工具 。 


14.5.1 re 模块 


不 同 的 语言 均 有 使 用 正则 表达 式 的 方法 ,但 各 不 相同 。Python 是 通过 re 模块 来 实现 的 。 
接 下 来 ,我 们 边 写 例子 边 给 大 家 讲解 ,这 样 比 较 容 易 理 解 : 


>>> import re 

>>> re.search(r'FishC', 'I love FishC. com! ') 

< sre.SRE Match object; span- (7, 12), match- 'FishC'» 

search() 方 法 用 于 在 字符 串 中 搜索 正则 表达 式 模式 第 一 次 出 现 的 位 置 ,这 里 找到 了 ,匹配 
的 位 置 是 (7, 12)。 

这 里 需要 注意 两 点 : 

(OD 第 一 个 参数 是 正则 表达 式 模 式 , 也 就 是 你 要 描述 的 搜索 规则 ,需要 使 用 原始 字符 串 来 
写 , 因 为 这 样 可 以 避免 很 多 不 必要 的 采 烦 。 

(2) 找到 后 返回 的 范围 是 以 下 标 0 开始 的 ,这 跟 字 符 串 一 样 。 如 有 果 找 不 到 , 它 就 返回 


None, 


14.5.2 通配符 
有 些 读者 朋友 可 能 会 产生 质疑 了 :“ 你 说 了 那么 多 ,我 用 find() 方 法 不 一 样 可 以 实现 吗 ?? 


>>> "I love FishC. com! ". find( 'FishC') 
7 


好 , 那 来 一 个 find() 方 法 没 法 实现 的 …… 

大 家 都 知道 通配符 ,就 是 x 和 ?, 用 它 来 表示 任何 字符 。 例 如 想 找到 所 有 Word 类 型 的 文 
件 时 ,我 们 就 输入 * . docx, 对 不 对 ? 

正则 表达 式 也 有 所 谓 的 通配符 ,在 这 里 是 用 一 个 点 号 (. ) 来 表示 , 它 可 以 匹配 除了 换行 符 
之 外 的 任何 字符 : 

>>> re.search(r'.', 'I love FishC. com! ') 

< sre.SRE Match object; span- (0, 1), match- ' 工 > 


>>> re.search(r'Fish. ', 'I love FishC. con! ') 
< sre. SRE Match object; span- (7, 12), match- 'FishC'» 


14.5.3 反 斜 杠 


喜欢 思考 的 读者 朋友 现在 可 能 会 有 疑问 了 :“ 既 然 点 号 (. ) 可 以 匹配 任何 字符 , 那 如 果 现 
在 只 想 单单 匹配 点 号 (. ) 这 个 字符 本 身 , 要 怎么 办 呢 ?” 

正如 Python 的 字符 串 规则 , 想 要 消除 一 个 字符 的 特殊 功能 ,就 在 它 前 边 加 上 反 和 斜 杠 , 这 
里 也 一 样 : 
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>>> re.search(r'.', 'I love FishC. com! ') 

« sre.SRE Match object; span- (0, 1), match- ' 工 > 

>>> re.search(r'M.', 'I love FishC. com! ') 

< sre.SRE Match object; span- (12, 13), matchs '. > 

在 正则 表达 式 中 , 反 斜 杠 可 以 剥夺 元 字符 ( 注 : 元 字符 就 是 拥有 特殊 能 力 的 符号 , 像 刚才 
的 点 号 (. ) 就 是 一 个 元 字符 ) 的 特殊 能 力 。 同 时 , 反 斜 杠 还 可 以 使 得 普通 字符 拥有 特殊 能 力 。 

举 个 例子 ,例如 想 匹 配 数字 ,那么 可 以 使 用 反 斜 杜 加 上 小 写字 母 d(\d): 


>>> re. search(r'\d', 'I love 123 FishC. con! ') 
< sre.SRE Match object; span- (7, 8), match= '1'> 


有 了 以 上 两 点 知识 ,要 匹配 一 个 IP 地址 大 概 就 可 以 这 么 与 : 


>>> re. search(r'\d\d\d\. \d\d\d\. \d\d\d\. \d\d\d', 'other192.168.111.253other') 

< sre.SRE Match object; span= (5, 20), match= '192. 168.111.253 

当然 这 么 写 是 有 问题 的 : 首先 ,\d 表示 匹配 0 一 9 所 有 的 数字 ,而 IP 地 址 约定 的 范围 是 
0 一 255,\d\d\d 表示 的 范围 则 是 000—999; 其 次 ,你 这 里 要 求 IP 地 址 的 每 个 组 成 部 分 都 需 
要 三 个 数字 , 而 现实 中 经 常 是 像 192. 168. 1. 1 这 样 ; 最 后 ,这 样 的 正则 表达 式 未 免 也 太 丑 
了 了 吧 ?! 

既然 有 问题 , 那 就 有 解决 的 方案 ,下 边 逐 个 来 解决 ! 


14.5.4 -字符 类 


为 了 表示 一 个 字符 的 范围 ,可 以 创建 一 个 字符 类 。 使 用 中 括号 将 任何 内 容 包 起 来 就 是 一 
个 字符 类 , 它 的 含义 是 你 只 要 匹配 这 个 字符 类 中 的 任何 字符 ,结果 就 算 作 匹配 。 
举 个 例子 ,比如 想 要 匹配 到 元 音字 母 , 那 可 以 这 么 写 : 


>>> re.search(r'[aeiou]', 'I love 123 FishC. com! ') 
< sre.SRE Match object; span- (3, 4), match- 'o'» 


有 些 读者 朋友 可 能 会 有 疑惑 :“ 大 写字 母 1 也 是 元 音字 母 ,怎么 不 匹配 它 呢 ?” 
这 是 因为 正则 表达 式 默 认 是 区 分 大 小 写 的 ,所 以 大 写 的 工 跟 小 写 的 1 会 区 分 开 。 解 决 的 
方案 有 两 种 : 第 一 是 关闭 大 小 写 敏 感 模式 ,这 个 后 边 再 讲 ; 第 二 就 是 修改 的 字符 类 : 


>>> re.search(r'[aeiouAEIOU]', 'I love 123 FishC. con! ') 
« sre.SRE Match object; span- (0, 1), match- ' 工 > 


如 上 ,字符 类 中 的 任何 一 个 字符 匹配 ,那么 就 算 匹 配 成 功 。 在 中 括号 中 ,还 可 以 使 用 小 横 


>>> re.search(r'[a- z]', 'I love 123 FishC. con! ') 
< sre.SRE Match object; span- (2, 3), match» '1 > 


同样 可 以 用 来 表示 数字 的 范围 : 


>>> re. search(r'[0- 2][0- 5][0—5]', 'I love 123 FishC. con! ') 
< sre.SRE Match object; span- (7, 10), match= '123'» 
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14.5.5 -重复 匹配 


数字 范围 的 问题 解决 了 。 接 下 来 需要 处 理 第 二 个 问题 一 一 匹配 个 数 的 问题 。 用 大 括号 这 
对 元 字符 来 实现 重复 匹配 的 功能 : 

>>> re. search(r'ab{3}c', 'abbbc') 

< sre. SRE Match object; span= (0, 5), match = 'abbbc'> 

看 ,不 多 不 少 , 正 好 三 个 可 以 匹配 。 

如 果 有 五 个 ? 那 不 好 意思 ,匹配 不 了 : 


>>> re.search(r'ab(3]c', 'abbbbbc') 
>>> 


重复 的 次 数 也 可 以 取 一 个 范围 : 


>>> re. search(r'ab{3,5}c', 'abbbbbc') 

< sre.SRE Match object; span= (0, 7), match = 'abbbbbc > 

>>> re.search(r'ab(3,5]c', 'abbbc') 

< sre.SRE Match object; span= (0, 5), match = 'abbbc '> 

咽 ,看 到 大 家 似乎 已 经 信心 满 满 \ 跃跃欲试 ,我 忍 不 住 还 是 要 来 打击 一 下 大 家 : 请 问 如 何 
用 正则 表达 式 匹配 0 一 255 这 个 范围 的 数 ? 

我 知道 有 些 读者 朋友 想 都 不 用 想 就 会 这 么 写 : 

>>> re. search(r'[0- 255]', '188") 

< sre.SRE Match object; span- (0, 1), match- '1'» 


或 者 会 这 么 写 : 


>>> re. search(r'[0-2][0-5][0-5]', '188") 
>>> 


怎么 样 ? 果然 跟 你 想象 的 不 一 样 吧 ! 

要 记 住 ,正则 表达 式 匹 配 的 字符 串 ,所 以 数字 对 于 字符 来 说 只 有 0 一 9, 像 123 WEH 172737 
三 个 字符 构成 的 。[0-255] 这 个 字符 类 表示 0 一 2 还 有 两 个 5, 所 以 是 匹配 0125 四 个 数字 中 任 
何 一 个 。 

要 匹配 0 一 255 这 个 范围 的 数字 ,正则 表达 式 应 该 这 么 写 : 


>>> re. search(r'[0- 1]\d\d|2[0 - 4]Xd|25[0— 5]', 188") 
< sre.SRE Match object; span- (0, 3), match- '188 > 


>>> re. search(r'([01]NXdMd|2[0 - 4]\d|25[0 - 5]\. ) (3) ([01]NaNd| 2[0 - 4]Nd| 25[0 — 5]) ', 'other192. 


168.1.1other') 
>>> 


小 括号 是 表示 分 组 ,这 跟 数 学 中 小 括号 起 到 的 作用 类 似 。 一 个 小 组 就 是 一 个 整体 ,我们 后 
边 加 上 重复 次 数 (3}) ,表示 这 个 小 组 的 规则 需要 重复 匹配 三 次 才 算 成 功 。 

那 现 在 问题 出 在 哪儿 呢 ? 眼 尖 的 朋友 发 现 了 一 一 这 里 没有 充分 考虑 数字 的 位 数 。 

因为 数字 1 并 不 会 刻意 写成 001 这 样 三 位 数 ,所 以 再 稍 作 修 改 : 
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>>> re. search(r'(([01]{0,1}\d{0,1}\d|2[0 - 4]\d|25[0 -5])\.){3}([01]{0,1}\d{0,1}\dl2[0 - 4]\d 
|25[0-5])', 'other192.168.1.1other') 
< sre. SRE Match object; span= (5, 16), match = '192.168.1.1'> 


搞定 ! 大 家 现在 应 该 可 以 充分 理解 “ 当 你 发 现 一 个 问题 可 以 用 正则 表达 式 来 解决 的 时 
候 ,于 是 你 就 有 两 个 问题 了 ”这 句 话 。 但 大 家 也 充分 了 解 到 掌握 正则 表达 式 的 必要 性 。 由 
于 这 里 主要 是 讲解 Python 的 爬虫 应 用 ,所 以 并 没有 花 太 多 的 时 间 来 讲解 正则 表达 式 的 隐藏 
技能 。 

这 里 作者 翻译 了 Python 官方 的 一 篇 关于 正则 表达 式 的 HOWTO 文档 ,大 家 可 以 参考 . 
http://bbs. fishc. com/thread-57073-1-1. html, 


14.5.6 特殊 符号 及 用 法 


: ar 
在 Python ri, EWR 3 st di Je DLE SP E So 9. TE DU e ARRA E 
之 处 在 于 特殊 符号 的 应 用 ,特殊 符号 定义 了 字符 集合 、 子 组 匹配 .模式 重复 次 数 。 正 是 这 些 特 
珠 符号 使 得 一 个 正则 表达 式 可 以 匹配 一 个 复杂 的 规则 而 不 仅仅 只 是 一 个 字符 串 。 
表 14-1 说 明了 Python3 正则 表达 式 特 殊 符号 及 用 法 。 
R 14-1 Python3 正则 表达 式 特殊 符号 及 用 法 


字 H8 € Xx 
表示 匹配 除了 换行 符 外 的 任何 字符 。 注 : 通过 设置 re. DOTALL 标志 可 以 使 .匹配 任何 
字符 (包含 换行 符 ) 
A | B, 表 示 匹 配 正则 表达 式 A 或 者 B 
( 脱 字符 ) 匹配 输入 字符 串 的 开始 位 置 。 如 果 设 置 了 re MULTILINE 标志 ,“^ 也 匹配 换行 


符 之 后 的 位 置 

$ 匹配 输入 字符 串 的 结束 位 置 。 如 果 设 置 了 re MULTILINE 标志 , $ 也 匹配 换行 符 之 前 
的 位 置 

\ 将 一 个 普通 字符 变 成 特殊 字符 ,例如 ,\d 表示 匹配 所 有 十 进 制 数字 。 解 除 元 字符 的 特殊 
功能 ,例如 ,\. 表示 匹配 点 号 本 身 。 引 用 序号 对 应 的 子 组 所 匹配 的 字符 串 
字符 类 ,匹配 所 包含 的 任意 一 个 字符 。 注 : 连 字 符 - 如 果 出 现在 字符 串 中 间 表 示 字 符 范 围 

[.] 描述 ; 如 果 出 现在 首位 则 仅 作为 普通 字符 。 特 殊 字符 仅 有 反 斜 线 \ 保 持 特殊 含义 ,用 于 转 
义 字 符 。 其 他 特殊 字符 如 x 、 十 、? 等 均 作 为 普通 字符 匹配 。 脱 字符 ^ 如 果 出 现在 首位 则 
表示 匹配 不 包含 其 中 的 任意 字符 ; 如 果 “^ 出 现在 字符 串 中 间 就 仅 作为 普通 字符 匹配 

PE M 和 N 均 为 非 负 整数 ,其 中 M <= N, 表 示 前 边 的 RE 匹配 M — NK. iE: {M,} 表 示 
至 少 匹 配 M 次 ; {,NN} 等 价 于 {0,N}); {(N} 表 示 需 要 匹配 N 次 

x 匹配 前 面 的 子 表达 式 零 次 或 多 次 ,等 价 于 {0,)} 

十 匹配 前 面 的 子 表达 式 一 次 或 多 次 ,等 价 于 {1,} 

? 匹配 前 面 的 子 表 达 式 零 次 或 一 次 ,等 价 于 {0,1) 


默认 情况 下 x* 、 十 和 ?的 匹配 模式 是 贪 禁 模式 ( 即 会 尽 可 能 多 地 匹配 符合 规则 的 字符 串 ); 
x2, 十 ?，?? x2.-F? 和 ?? 表示 启用 对 应 的 非 贪 禁 模式 。 举 个 例子 : 对 于 字符 串 "FishCCC" ,正则 表达 
x FishC 十 会 匹配 整个 字符 串 , 而 FishC 十 ?” 则 匹配 "FishC" 


{M,N}? 同上 ,启用 非 贪 禁 模 式 , 即 只 匹配 M 次 
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续 表 
字 8 含 x 


匹配 圆 括号 中 的 正则 表达 式 ,或 者 指定 一 个 子 组 的 开始 和 结束 位 置 
Cd iE: 子 组 的 内 容 可 以 在 匹配 之 后 被 \ 数 字 再 次 引用 

举 个 例子 : Awt) \1 可 以 字符 串 "FishC FishC. com" 中 的 "FishC FishC" (注意 有 空格 ) 
£A (? 开头 的 表示 为 正则 表达 式 的 扩展 语法 (下 边 这 些 是 Python 支持 的 所 有 扩展 语法 ) 
l. (? 后 可 以 紧 跟 着 'a'、'i、L'、'm'、's'、'u'、'x' 中 的 一 个 或 多 个 字符 ,只 能 在 正则 表达 式 的 
开头 使 用 
2. 每 一 个 字符 对 应 一 种 匹配 标志 : re-A( 只 匹配 ASCI 字符 ) ,re-I( 忽 略 大 小 写 ) ,re-L( 区 
域 设 置 ) ,re-M( 多 行 模式 ), re-SC 匹配 任何 符号 ) ,re-X( 详 细 表 达 式 ) ,包含 这 些 字符 将 会 
影响 整个 正则 表达 式 的 规则 
3. 当 你 不 想 通过 re. compile() 设 置 正则 表达 式 标 志 , 这 种 方法 就 非常 有 用 啦 
注意 ,由 于 (? x) 决 定 正则 表达 式 如 何 被 解析 ,所 以 它 应 该 总 是 被 放 在 最 前 边 ( 最 多 允许 前 
边 有 空白 符 )。 如 果 (? x) 的 前 边 是 非 空 白字 符 , 那 么 (? x) 就 发 挥 不 了 作用 了 


Ee 非 捕获 组 , 即 该 子 组 匹配 的 字符 串 无 法 从 后 边 获 取 

(?P 一 name>...) | 命名 组 ,通过 组 的 名 字 (Cname) 即 可 访问 到 子 组 匹配 的 字符 串 

(? P— name) 反问 引用 一 个 命名 组 , 它 匹 配 指 定 命 名 组 匹配 的 任何 内 容 

(2.9 注释 ,括号 中 的 内 容 将 被 忽略 

前 向 肯定 断言 。 如 果 当 前 包含 的 正则 表达 式 ( 这 里 以 ... 表 示 ) 在 当前 位 置 成 功 匹 配 , 则 代 
表 成 功 ,否则 失败 。 一 旦 该 部 分 正则 表达 式 被 匹配 引擎 和 尝试 过 ,就 不 会 继续 进行 匹配 了 ; 
剩 下 的 模式 在 此 断言 开始 的 地 方 继续 尝试 。 举 个 例子 : love(? 三 FishC) 只 匹配 后 边 紧 中 
着 "FishC" 的 字符 串 "love" 

前 癌 否 定 断 言 。 这 跟前 向 肯定 断言 相反 (不 匹配 则 表示 成 功 , 匹 配 表 示 失 败 )。 

举 个 例子 : FishCC?! \. com) 只 匹配 后 边 不 是 ". com" 的 字符 串 "FishC" 

后 向 肯定 断言 。 跟 前 向 肯定 断言 一 样 ,只 是 方向 相反 。 

举 个 例子 : (? 二 ==love)FishC 只 匹配 前 边 紧 跟着 "love" 的 字符 串 "FishC" 

后 回 和 否定 断言 。 跟 前 向 肯定 断言 一 样 , 只 是 方向 相反 。 

举 个 例子 : (? <! FishO)\. com 只 匹配 前 边 不 是 "FishC" 的 字符 串 ". com" 


l. 如 果子 组 的 序号 或 名 字 存 在 的 话 , 则 尝试 yes-pattern 匹配 模式 ; 否则 尝试 no-pattern 
匹配 模式 

(? (id/name)yes- |2. no-pattern 是 可 选 的 

pattern| no- pattern) | 举 个 例子 : (<)? (Nw 十 @\w 十 (?:\.\w 十 ) 十 )(? (1) 二 1$) 是 一 个 匹配 邮件 格式 的 正 
Wi] X 3A 5X , nf LJ VU Bid — user (9 fishc. com M 'user (9 fishc. com ' ,但 是 不 会 匹配 ' — user (2 
fishc. com 'zX;, 'user@ fishc. com ' 


下 边 列 举 了 由 字符 \ "和 另 一 个 字符 组 成 的 特殊 含义 。 注 意 ,\' 十 元 字符 的 组 合 可 以 解除 
元 字符 的 特殊 功能 


1. 引用 序号 对 应 的 子 组 所 匹配 的 字符 串 , 子 组 的 序号 从 1 开始 计算 

2. 如 果 序 号 是 以 0 开头 ,或 者 3 个 数字 的 长 度 。 那 么 不 会 被 用 于 引用 对 应 的 子 组 ,而 是 
\ 序 号 用 于 匹配 八进制 数字 所 表示 的 ASCI 码 值 对 应 的 字符 

举 个 例子 :(. 十 ) M 会 匹配 "FishC FishC" 或 "55 55" ,但 不 会 匹配 "FishCFishC" (注意 , 因 

为 子 组 后 边 还 有 一 个 空格 ) 


\A 匹配 输入 字符 串 的 开始 位 置 
\z 匹配 输入 字符 串 的 结束 位 置 


匹配 一 个 单词 边界 ,单词 被 定义 为 Unidcode 的 字母 数字 或 下 横 线 字符 
举 个 例子 : \bFishC\b 会 匹配 字符 串 "love FishC"、FishC. "或 "(FishC)" 


(? aiLmsux) 
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\B 


Md 


AD 


s 


AS 


Nw 


AW 


转 义 符号 
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字 


符 


续 表 

含 义 
匹配 非 单词 边界 ,其 实 就 是 与 \b 相反 
举 个 例子 : py\B 会 匹配 字符 串 "python"、"py3" 或 "py2" ,但 不 会 匹配 "py"、"py. " xx" py!" 
1. 对 于 Unicode(str 类 型 ) 模 式 : 匹配 任何 一 个 数字 ,包括 L0-9j 和 其 他 数字 字符 ; 如 果 开 
Ji T re. ASCII 标志 ,就 只 匹配 L0-9] 
2. 对 于 8 位 (bytes 类 型 ) 模 式 : 匹配 L0-9j 中 任何 一 个 数字 
匹配 任何 非 Unicode 的 数字 ,其 实 就 是 与 \d 相反 ; 如 果 开 启 了 re. ASCI 标志 , 则 相当 于 
匹配 [^0-9] 
1. 对 于 Unicode(str 类 型 ) 模 式 : 匹配 Unicode 中 的 空白 字符 (包括 [ \t\n\r\f\vj 以 及 其 
他 空白 字符 ); 如 果 开 启 了 re. ASCII 标志 ,就 只 匹配 [ \t\n\r\f\vj 
2. 对 于 8 位 (bytes 类 型 ) 模 式 : 匹配 ASCI 中 定义 的 空白 字符 , 即 [ \t\n\r\f\vj 
匹配 任何 非 Unicode 中 的 空白 字符 ,其 实 就 是 与 \s 相反 ; 如 果 开 启 了 re. ASCI 标志 , 则 
相当 于 匹配 [^\t\n\r\f\vj 
1. 对 于 Unicode(str 类 型 ) 模 式 : 匹配 任何 Unicode 的 单词 字符 ,基本 上 所 有 语言 的 字符 都 
可 以 匹配 ,当然 也 包括 数字 和 下 横 线 ; 如 果 开 启 了 re. ASCI 标志 ,就 只 匹配 La-zA-2Z0-9_] 
2. 对 于 8 位 (bytes 类 型 ) 模 式 : 匹配 ASCI 中 定义 的 字母 数字 , 即 [La-zA-Z0-9_] 
匹配 任何 非 Unicode 的 单词 字符 ,其实 就 是 与 \w 相反 ; 如 果 开 启 了 re. ASCI 标志 , 则 相 
当 于 [^a-zA-Z0-9 ] 
正则 表达 式 还 文 持 大 部 分 Python 字符 串 的 转 义 符号 : Na Nb M NN NCG Na NUN e We 
ik: \b 通常 用 于 匹配 一 个 单词 边界 ,只 有 在 字符 类 中 才 表示 GB HET; \u 和 \U 只 有 在 
Unicode 模式 下 才 会 被 识别 ; 八进制 转 义 (人 \ 数 字 ) 是 有 限制 的 ,如 果 第 一 个 数字 是 0 ,或 者 
如 果 有 3 个 八进制 数字 ,那么 就 被 认为 是 八进制 数 ; 其 他 情况 则 被 认为 是 子 组 引用 ; 至 
于 字符 串 ,八进制 转 义 总 是 最 多 只 能 是 3 个 数字 的 长 度 


有 些 读者 看 到 这 个 内 心 可 能 会 犯 咬 哺 :“ 好 多 我 也 是 见 过 世面 的 人 啊 , 为 了 查找 一 个 字符 
串 , 丰 的 有 必要 测 握 这 么 多 新 规则 吗 ?” 

实话 说 ,不 需要 ! 这 里 只 是 帮 大 家 把 Python3 所 有 支持 的 正则 表达 式 语法 给 列举 出 来 ， 
实际 应 用 只 需要 用 到 这 里 边 的 一 小 部 分 。 男 外 的 一 大 部 分 主要 是 为 了 应 对 “ 突 发 情况 ”而 准备 
的 。 这 个 列表 大 家 可 以 收藏 起 来 ,在 需要 的 时 候 翻 出 来 查 一 查 就 可 以 了 , 千 万 不 要 去 死记 使 背 。 
我 们 说 的 特殊 符号 其 实 是 由 两 部 分 组 成 : 一 部 分 是 元 字符 , 丸 一 部 分 是 由 反 斜 枉 加 上 普 
通 符 号 组 成 的 (这 有 点 像 Python 字符 串 的 转 义 符 ) 。 


14.57 元 字符 
以 下 是 正则 表达 式 所 有 的 元 字符 : 


$ 


+? {} []】 \ | (€) 


它们 各 自 都 有 特殊 的 含义 ,例如 点 号 (. ) 表 示 匹 配 除 换行 符 外 的 任何 字符 ,管道 符 (| ) 则 有 
点 类 似 于 这 个 逻辑 或 操作 : 
>>> re. search(r"Fish(C|D)", "FishC") 


< sre.SRE Match object; span- (0, 5), match- 'FishC'» 
>>> re. search(r"Fish(C|D)", "FishD") 
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« sre.SRE Match object; span= (0, 5), match= 'FishD'> 
脱 字 符 (^) 表 示 匹 配 字符 串 的 开始 位 置 , 也 就 是 说 ,只 有 目标 字符 串 出 现在 开头 才 会 匹配 : 


>>> re. search(r"^FishC", "I love FishC. com! ") 

>>> re.search(r"^FishC", "FishC.com!") 

« sre.SRE Match object; span- (0, 5), match= 'FishC' 

美元 符号 ($ ) 则 表示 匹配 字符 串 的 结束 位 置 ,也 就 是 说 ,只 有 目标 字符 串 出 现在 末尾 才 会 
pt f : 


>>> re.search(r'FishC$ ", "FishC.com!") 

>>> re.search(r"FishC$ ", "love FishC") 

< sre.SRE Match object; span- (5, 10), match= 'FishC'» 

反 斜 杠 在 正则 表达 式 中 用 处 最 为 广泛 , 它 既 可 以 将 一 个 普通 字符 变 成 特殊 字符 (这 个 待 会 
儿 讲 ) , 它 还 可 以 解除 元 字符 的 特殊 功能 ,如 果 反 斜 杠 后 边 加 上 的 是 数字 , 那 它 还 有 两 种 用 法 : 
如 果 跟 着 的 数字 是 1 一 99 ,那么 它 表 示 引 用 序号 对 应 的 子 组 所 匹配 的 字符 串 ; 如 果 跟 着 的 数字 
是 0 开头 或 痢 是 三 位 数字 ,那么 它 是 一 个 八进制 数 , 表 示 的 是 这 个 八进制 数 对 应 的 ASCH 
字符 。 

听 到 这 里 大 家 肯定 是 一 头 筋 水 ,你 先 别 急 ,我 一 步 步 给 你 解释 。 首 先 , 小 括号 (( RH 
一 对 元 字符 ,被 它们 括 起 来 的 正则 表达 式 称 为 一 个 子 组 。 子 组 有 什么 用 呢 ? 变 成 子 组 的 话 ,就 
可 以 把 它 当 作 一 个 整体 ,例如 在 后 边 对 它 进行 引用 : 


>>> re. search(r" (FishC)\1", "FishC. com") 


这 里 的 \1 表示 引用 前 边 序号 为 1 的 子 组 (也 就 是 第 一 个 子 组 ), 所 以 (r" (FishC)\1" 相 当 
于 r"FishCFishC"。 因 此 你 无 法 匹配 只 有 一 个 “FishC” 的 “FishC. com”, 要 写 连 续 两 个 “FishC” 
才能 成 功 匹 配 . 


>>> re. search(r" (FishC)\1", "FishCFishC") 
« sre.SRE Match object; span= (0, 10), match= 'FishCFishC'> 


如 有 果 反 和 斜 杠 后 边 跟着 的 数字 是 0 开头 或 者 三 位 的 数字 ,那么 会 把 这 三 位 数字 作为 一 个 八 
进 制 数 来 看 待 . 

>>> re. search(r" (FishC)\060", "FishCFishC0") 

< sre.SRE Match object; span= (5, 11), match= ' 了 ishC0O > 

>>> # ik: 八进制 60 对 应 的 ASCII 码 是 数字 0 

>>> re. search(r"MA41FishC", "aFishCFishC") 

< sre.SRE Match object; span- (0, 6), match- 'aFishC' 

>>> # ik: 八进制 141 对 应 的 ASCII 码 是 小 写字 母 a 


接 下 来 是 中 括号 (| ])) 这 对 元 字符 ,说 它 是 生成 一 个 字符 类 ,事实 上 就 是 一 个 字符 集合 。 
被 它 包 围 在 里 边 的 元 字符 都 失去 了 特殊 的 功能 ,就 像 反 和 斜 枉 加 上 元 字符 的 作用 是 一 样 的 : 


>>> re. search(r"[.]", "FishC. com") 
« sre.SRE Match object; span- (5, 6), match= '. > 


字符 类 的 意思 就 是 在 它 里 边 的 内 容 , 都 把 它们 当成 普通 字符 类 看 待 ,除了 几 个 特殊 的 
字符 : 


e 181 。 
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(1) 小 横 杠 (-) ,用 它 来 表示 范围 : 


>>> re. f£indall(r"[a- z]", "FishC.com") 
We MF "HS "n. "s. O 'm'] 


>>> # findall() 表 示 找 出 所 有 匹配 的 内 容 ,并 将 结果 返回 为 一 个 列表 。 
(2) 反 和 斜 杠 , 反 斜 杜 这 里 用 于 字符 串 转 义 , 例 如 \n 表示 匹配 换行 符号 : 


>>> re. search(r"[\n]", "FishC. com\n") 
< sre.SRE Match object; span- (9, 10), match= '\n'> 


(3) AFF, HET Am BUS IR) X IB. 

>>> re. findall(r"[^a- z]", "FishC. com") 

RUE 

最 后 介绍 的 元 字符 是 用 来 做 重复 的 事情 ,例如 前 面 讲 的 大 括号 ({ }) 


>>> re. search(r"FishC(3]", "FishCCC. con") 
< sre.SRE Match object; span- (0, 7), match = 'FishCCC'» 


如 果 前 边 是 一 个 子 组 ,那么 表示 整个 子 组 重复 的 次 数 : 


>>> re. search(r" (FishC){3}", "FishCCC. com") 
>>> re. search(r" (FishC){3}", "FishCFishCFishC") 
< sre.SRE Match object; span- (0, 15), match= 'FishCFishCFishC'> 


为 外 还 可 以 表示 一 个 范围 ,就 是 多 少 次 到 多 少 次 之 间 ，: 


>>> re. search(r"(FishC){1,3}", "FishCFishCFishC") 
< sre.SRE Match object; span= (0, 15), match= 'FishCFishCFishC'> 


这 里 有 一 点 需要 注意 ,在 正则 表达 式 中 ,你 不 能 随便 用 空格 : 


>>> re. search(r" (FishC){1, 3}", "FishCFishCFishC") 
>>> 


你 看 ,加 上 空格 它 就 匹配 不 了 了 。 

另外 表示 重复 的 元 字符 还 有 : * ,十 和 ? 

。 星 号 (* ) 相 当 于 {0，,} 。 

。 加 号 (十 ) 相 当 于 {1,}。 

。 问号 (?) 相 当 于 {0,1})。 

如 果 条 件 一 样 ,推荐 大 家 使 用 * 、 十 和 ?， wipe MODA 


擎 内 部 对 这 三 个 符号 进行 了 优化 ,所 以 效率 要 比 使 用 大 括号 高 一 


14.5.8 AMIER 


关于 重复 的 操作 ,有 一 点 需要 注意 的 ,就 是 正则 表达 式 默 认 是 局 用 贪 焚 的 匹配 方式 。 什 么 
信 焚 的 匹配 方式 ?就 是 说 ,只 要 在 符合 的 条 件 下 , 它 会 尽量 多 地 去 匹配 : 


>>> g = "<html ><title>I love FishC.com </title></html >" 


>>> re. search( <. +>', s) 


e 182 * 
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« sre.SRE Match object; span- (0, 44), match- '< html >< title» I love FishC. com</title ></html > > 


上 面 的 代码 ,本 来 想 匹 配 过 html 二 ,但 这 里 由 于 贪 焚 模 式 的 原因 , 它 直 接 匹 配 了 整个 字符 
串 。 很 明显 这 不 是 我 们 想 要 的 。 我 们 希望 在 遇 到 第 一 个 “ 盖 ” 的 时 候 就 停 下 来 ,需要 使 用 非 贪 
焚 模 式 。 那 非 贪 禁 横 式 怎么 启用 呢 ? 很 简单 ,在 表示 重复 的 元 字符 后 边 再 加 上 一 个 问号 (?) 
即 可 : 


>>> re.search(' «. + ?>', s) 
< sre. SRE Match object; span= (0, 6), match= '< html > > 


ni ,正则 表达 式 的 所 有 元 字符 终于 全 部 介绍 完毕 了 。 
14.5.9 反 和 斜 杠 十 普通 字母 = 特殊 含义 


正则 表达 式 的 特殊 符号 除了 元 字符 外 ,还 有 一 种 就 是 通过 反 斜 杠 加 上 普通 字 扣 各 [33 
母 构 成 的 特殊 符号 。 

首先 是 反 斜 枉 加 序号 (序号 ): 

(D 如 果 这 个 序号 的 范围 是 1 一 99 ,那么 表示 引用 序号 对 应 的 子 组 所 匹配 的 字符 串 ( 子 组 
的 序号 是 从 1 开始 算 起 的 ); 

(2) 如 果 序 号 是 以 0 开头 ,或 者 是 三 位 数字 的 长 度 。 那 么 不 会 被 用 于 引用 对 应 的 子 组 ,而 
是 用 于 匹配 八进制 数字 所 表示 的 ASCI 码 值 对 应 的 字符 。 

VA 跟 脱 字 符 (^) 在 默认 情况 下 是 一 样 的 ,都 表示 匹配 字符 串 的 起 始 位 置 。 也 就 是 说 ,只 要 
前 边 是 \A 或 者 “符号 ,那么 这 个 字符 就 必须 出 现在 字符 串 的 开头 才 算 匹配 。 

MZ 跟 美 元 符号 $ 在 默认 情况 下 是 一 样 的 ,都 表示 匹配 字符 串 的 结束 位 置 。 

注意 ,刚才 介绍 的 是 在 默认 情况 下 一 样 ,并 不 是 说 它们 完全 一 样 。 因 为 正则 表达 式 还 有 个 
标志 的 设置 ,如 果 设 置 了 re. MULTILINE 标志 ,那么 ^ 和 $ 元 字符 还 可 以 匹配 换行 符 的 位 置 ， 
而 \A 和 \Z 则 只 能 匹配 字符 串 的 起 始 和 结束 位 置 。 


no 
Wn 
Lg 


们 只 用 于 匹配 一 个 位 置 。 

接 下 来 是 \b, 它 也 是 一 个 零 宽 断 言 ,表示 匹配 一 个 单词 的 边界 ,单词 这 里 被 定义 为 
Unidcode 的 字母 数字 或 下 横 线 字符 。 举 个 例子 : 

>>> re. findall(r"\bFishC\b", "FishC. com! FishC com!FishC (FishC)") 

['FishC', 'FishC', 'FishC'] 

UEXE.xX HORAE ESXJg"Rg".WrETETNO'FishC com"Jé^ Zz 8 Ut sem. 

>>> re. search(r"\bFishC\b", "FishC com") 


与 \b 相反 ,\B 匹配 的 则 是 非 单词 边界 。 

还 有 \d 匹配 的 是 Unicode 中 定义 的 数字 字符 ,Unicode 是 Python3 默认 的 字符 串 类 型 。 
如 果 开 启 了 re. ASCI 标志 ,表示 匹配 ASCH 码 中 定义 的 数字 ,也 就 是 0 一 9。 如 果 你 在 字符 串 
前 加 上 b ,说 明 你 想 将 字符 串 定义 为 bytes 类 型 ,那么 匹配 的 就 是 0 一 9。 

与 \d 相反 ,\D 匹配 的 是 非 Unicode 定义 的 数字 字符 。 

同样 Ns 表示 匹配 任何 空白 字符 ,例如 Nt 表示 tab 键 ( 制 表 键 ) ,\n 表示 换行 符 ,\r 表示 回 


e 183 。 


«|| 零 基 础 入 门 学 习 Python 


Ag NE 表示 换 页 符 ,\v 则 表示 垂直 的 tab 键 (\t 是 水 平 制 表 键 ) 。 

同 理 ,\S 是 \s I BU 。 

Vw 表示 匹配 Unicode 中 定义 的 单词 学 符 , 如 果 开 启 了 re. ASCI 标志 , 则 只 匹配 La-zA- 
Z0-9 ]; 否则 ,每 个 字 都 属于 单词 字符 的 范围 : 

>>> re. dear ciel bain ies eg FishC. com! )") 

[€', X, fü, Ch dE, EC, w Wu We fma he Dr Ne Dy €» Us 2 

同样 ,\W 是 \w 的 取 反 。 

除 此 之 外 ,正则 表达 式 还 支持 大 部 分 Python 字符 串 的 转 义 符号 : Na. Nb NM Nn Nr NC Nu: 
AU, NNNM 

ik 1; Vb 通常 用 于 匹配 一 个 单词 边界 ,只 有 在 字符 类 中 才 表 示 “ 退 格 ”。 

ik 2: Nu 和 \U 只 有 在 Unicode 模式 下 才 会 被 识别 。 

ik 3: 八进制 转 义 人 数字) 是 有 限制 的 ,如 果 第 一 个 数字 是 0, 或 者 如 果 有 三 位 八进制 数 
字 ,那么 就 被 认为 是 八进制 数 ; 其 他 情况 则 被 认为 是 子 组 引用 ; 至 于 字符 串 ,八进制 转 义 总 是 
最 多 为 三 位 数字 的 长 度 。 


14.5.10 编译 正则 表达 式 
如 果 需 要 重复 使 用 某 个 正则 表达 式 , 那 么 可 以 先 将 该 正则 表达 式 编译 成 模式 对 象 。 使 用 
re. compile() 方 法 来 进行 编译 : 


>>> p = re.compile("[A - Z]") 

>>> p. search("I love FishC. con! ") 

< sre.SRE Match object; span- (0, 1), match- 'I'» 

>>> p.findall("I love FishC. com! ") 

[DTI CE. C] 

正如 大 家 所 见 , 使 用 的 方法 跟 调用 模块 级 别 的 方法 名 是 一 样 的 ,例如 search O RI findallO 。 
不 过 第 一 参数 就 不 再 需要 了 ,只 需要 传人 待 匹配 的 字符 串 即 可 。 


es 编译 标志 


通过 编译 标志 ,可 以 修改 正则 表达 式 的 工作 方式 。 表 14-2 列举 了 可 以 使 用 的 编译 标志 。 
表 14-2 编译 标志 


标 Gm € Xx 
ASCII, A 使 得 转 义 符号 如 \w,\b,\s 和 \d 只 能 匹配 ASCII 字符 
DOTALL, S 使 得 .匹配 任何 符号 ,包括 换行 符 
IGNORECASE, I 匹配 的 时 候 不 区 分 大 小 写 
LOCALE, L 支持 当前 的 语言 (区 域 ) 设 置 
MULTILINE, M 多 行 匹配 ,影响 ^ 和 $ 
VERBOSE, X (for 'extended ') 启用 详细 的 正则 表达 式 
A, ASCII 


fii Nw ,.NW ,Nb,NB,Ns 和 \S 只 匹配 ASCI 字符 ,而 不 匹配 完整 的 Unicode 字符 。 这 个 标 
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志 仅 对 Unicode 模式 有 意义 ,并 忽略 字 节 模式 。 


S.DOTALL 

使 得 点 号 (. ) 可 以 匹配 任何 字符 ,包括 换行 待 。 如 采 不 使 用 这 个 标志 ,点 号 (. ) 将 匹配 除了 
换行 符 的 所 有 字符 。 

I.IGNORECASE 


字符 类 和 文本 字符 串 在 匹配 的 时 候 不 区 分 大 小 写 。 举 个 例子 ,正则 表达 式 LA-Z] 也 将 会 
匹配 对 应 的 小 写字 母 , 像 FishC 可 以 匹配 FishC, fishe 或 FISHC 等 。 如 果 你 不 设置 
LOCALE, 则 不 会 考虑 语言 (区 域 ) 设 置 这 方面 的 大 小 写 问 题 。 

L.LOCALE 

fti £3 Nw ,NW Nb 和 \B 依赖 当前 的 语言 (区 域 ) 环 境 , 而 不 是 Unicode 数据 库 。 

区 域 设 置 是 C 语言 的 一 个 功能 ,主要 作用 是 消除 不 同 语言 之 间 的 差异 。 例 如 ,你 正在 处 
理 的 是 法 文 文本 ,你 想 使 用 \w 十 来 匹配 单词 ,但 是 \w 只 是 匹配 LA-Za-zj 中 的 单词 ,并 不 会 匹 
配 'é' 或 '?'。 如 果 你 的 系统 正确 地 设置 了 法 语 区 域 环境 , 那 么 C 语言 的 函数 就 会 告诉 程序 'é' 或 
'? ' 也 应 该 被 认为 是 一 个 字符 。 当 编译 正则 表达 式 的 时 候 设 置 了 LOCALE 的 标志 ,\w 十 就 可 
以 识别 法 文 了 ,但 速度 多 少 会 受到 影 啊 。 

M,MULTILINE 

通常 脱 字 符 (^) 只 匹配 字符 串 的 开头 ,而 美元 符号 ($$) 则 匹配 字符 串 的 结尾 。 当 这 个 标志 
被 设置 的 时 候 ,^ 不 仅 匹 配 字符 串 的 开头 ,还 匹配 每 一 行 的 行 首 ; $ 不 仅 匹 配 字 符 串 的 结尾 ,还 
匹配 每 一 行 的 行 尾 。 

X,VERBOSE 

这 个 标志 使 正则 表达 式 可 以 写 得 更 好 看 和 更 有 条 理 , 因 为 使 用 了 这 个 标志 ,空格 会 被 忽略 
(除了 出 现在 字符 类 中 和 使 用 反 斜 杠 转 义 的 空格 ); 这 个 标志 同时 允许 你 在 正则 表达 式 字 符 串 
中 使 用 注释 , 井 号 (# ) 后 边 的 内 容 是 注释 ,不 会 递交 给 匹配 引擎 (除了 出 现在 字符 类 中 和 使 用 
EHTE XLE). 

下 边 是 使 用 re. VERBOSE 的 例子 ,大 家 看 下 正则 表达 式 的 可 读 性 是 不 是 提高 了 : 


charref = re.compile(r""" 


&[ 8 ] # 开始 数字 引用 
( 

0[0- 7] * # 八进制 格式 

| [0-9] * # 十 进 制 格式 


| x[0- 9a- fA-F]* # 十 六 进 制 格式 
) 
- # 结尾 分 号 
""" , re.VERBOSE) 
如 果 没 有 设置 VERBOSE 标志 ,那么 同样 的 正则 表达 式 会 写成 ， 


charref = re.compile("&£ (0[0-7] 4 |[0- 9] * [x[0- 9a - £A- F] * );") 


哪个 可 读 性 更 佳 ? 相信 大 家 已 经 心里 有 底 了 。 
14.5.12. 实用 的 方法 
首先 说 search() 方 法 ,模块 级 别 的 search() 方 法 就 是 直接 调用 re. search() , 编 
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译 后 的 正则 表达 式 模式 对 象 也 同样 拥有 search() 方 法 。 那 请 问 : 它们 有 区 别 吗 ? 
下 面 ,看 看 它们 的 原型 : 


re.search(pattern, string, flags = 0) 
regex.search(string[, pos[, endpos]]) 


由 于 flags 标志 是 在 编译 的 时 候 就 同时 编译 进去 了 ,所 以 模式 对 象 就 不 需要 flags Y. 75 
外 模式 对 象 的 search() 方 法 还 可 以 设置 搜索 的 开始 和 结束 位 置 。 

还 有 ,re. search() 方 法 并 不 会 立刻 返回 你 可 以 使 用 的 字符 串 , 取 而 代 之 是 返回 一 个 匹配 
对 象 。 


>>> result = re.search(r" (Nw-* ) (\w+ )", "I love FishC. con! ") 
>>> result 
< sre.SRE Match object; span- (1, 12), match- ' love FishC'> 


这 时 候 需 要 使 用 匹配 对 象 的 一 些 方法 才能 获得 需要 的 内 容 。 例 如 ,使 用 group() 才 可 以 
获得 匹配 的 字符 串 : 


>>> result. group( ) 
' love FishC' 


值得 一 提 的 是 ,如 果 正则 表达 式 中 存在 子 组 ,那么 子 组 会 将 匹配 的 内 容 进行 捕获 。 通 过 在 
group() 中 设置 序号 ,可 以 提取 到 对 应 的 子 组 捕获 的 内 容 : 


>>> result.group(1) 
'love' 

>>> result. group(2) 
'FishC' 


然后 start ,end O HI span() 分 别 返回 匹配 的 开始 位 置 .结束 位 置 以 及 匹配 的 范围 : 


>>> result.start() 
1 

>>> result. end() 
12 

>>> result. span() 
(1, 12) 


接 下 来 是 findall() 方 法 。 这 个 容易 ,fandall() 方 法 不 就 是 找到 所 有 匹配 的 内 容 , 然 后 把 它 
们 组 织 成 列表 返回 吗 ? 没 错 , 这 是 在 正则 表达 式 里 边 没有 子 组 的 情况 下 做 的 事 。 如 果 正 则 表 
达 式 里 边 包 含 了 子 组 ,那么 findall() 会 更 聪明 。 下 边 通 过 案例 来 讲解 。 这 一 次 将 唯美 图 片 贴 
吧 的 一 些 图 片 下 载 下 来 吧 ，。 

目标 URL: http://tieba. baidu. com/p/3823765471 

踩点 结果 如 图 14-17 所 示 。 

一 轮 踩 点 下 来 ,我 们 发 现 该 贴吧 的 图 片 都 是 包含 在 二 img class— "BDE Image" > bp P 
的 ,例如 : 

< img class = " BDE Image" src = " http://imgsrc. baidu. com/forum/w% 3D580/sign = 


f9cf09409c25bc312b5d01906ede8de7/8f0ede0735fae6cdafb377ef0ab30f2443a70fda. jpg" pic ext = 
"jpeg" changedsize = "true" width = "560" height = "497"» 
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wX3D5BO,' /sign-B4e564Bf ce1349547e1eeB5c 6654 f 92dd* /17960524422a74d93312af3Bfda84bd11372f6801ds.jpg*" pic 9xt-*"jpegMV"  changedsirze-V"trueX? width-V" 5564". height=) "497" »«br»«ing 
class-A"BDE ImageXM" src-X http: V/N/imgsrc. baidu . comy/ forum / 4x30580V/sign-558b22ad4c5405232a6963762253d1dc V/178148a74933c895037944£54d41373 £f6838200da. jpgV" pic ext=\"jpeg\™ 
changedsize-X"truel" width-V "566A" height-\ 497\ ><br>cimg class-V"BDE 7mageM" smcc-V http V/S/ingsrcz.Saidu.com*S/forun V/V X30580* /5ign-172920e 20c23d0542173a760e188b3df^ / 
5a820333cB835d143717138ad75*0878025baf07da.jpg^" pic ext-X"jpegV"  changedsize-W"trueV" widthe4" 550A" height-X"497Y"5«br»4img class-X"BDE. IeageX* src-X" http: /Aimgsrc.baidu. con 
wX3D586 / s igri-946ee99448545646:565643183df9: des /01116629501434d04b8c 299244587025 a2f.450 06d. jpg" pic exbl-*"jpegNV" changes ises)" LeueV*. widLh-V" 568V*. height=) "497\ "7", "poustl no"- 
"8*,"comment num":0,"props^:null,"post index":8]])^» . i 
b «div classe"d authon" -<ydivy width 和 height 有 了 时候 会 出 现在 这 里 ~ 
Y«div class-"d post content main. d pusL conLent, firstflugs "5 
Vdiv class-"p content ^» 
> idiv class-"save face bg hidden save face 
è <div style-"word-wrapzbreak-word;width; 
"«cc» 


«img class-"BDE Image" src-"h Dai pon/ forum/vi2D530/sisn- 29bb3 p94 3950be 7bdbOcbeo i encd7büg4bCbeoQdOoa244227d3323Q0eda. jpg" pic ext-"jpeg" 
changedsize-"true" width="560" 

«br» 

<img class-"BDE Image" src-"ht: Q haid on/forum/v? $ ] 28£52603438279e2n88910124913/2ddfeccd7 0309925] d9892e69a473703933c9950dda, jpg" pic ext-"jpeg^ 
changedsire-"true" width-"568" 

«br» 

«img c1lass-"BDE Image" src=" baid om/ forum/wX3D530 /sign-600b55de31a85ed Bcfe2b73556948/Tec371893 0fb3d81eab19dc B895d0430cda.ipg" pic ext-" jpeg" 
changedsize-"true" width-"560" 

«br» 


«ing class-"BDE Image" src-"http: T baid Di Q n/ vá Q üin-$45addi65bdfSdbilb 6c3922dddb/63ac94510£b30£249a94302dcd954243ac4b03da. jpg" pic ext-"jpeg" 
changedsirc-"truo" width-"5SbB" i zt s 


14-17 踩点 


其 中 ,width 和 height 可 能 会 出 现在 class 二 "BDE Image" 以 及 src 之 间 。 
因此 ,可 以 写 出 对 应 的 正则 表达 式 应 该 是 : 


r'< img class = "BDE Image". * ?src="[^"] *\.jpg". * ?»' 
不 妨 先 用 IDLE 测试 下 : 


>>> import urllib. request 
>>> import re 
>>> response = urllib. request. urlopen("http://tieba. baidu. com/p/3823765471") 
>>> html = response. read().decode("utf - 8") 
>>> p = r'«img class = "BDE Image". * ?src - "[^"] * V. jpg". * ?>' 
>>> imglist = re.findall(p, html) 
>>> for each in imglist: 
print(each) 


< img class = "BDE Image" src = "http://imgsrc.baidu. com/forum/w % 3D580/sign = f9cf09409c25bc31- 
2b5d01906ede8de7 /8£0ede0735fae6cdafb377ef0ab30f2443a70fda. jpg" pic ext = "jpeg" changedsize = 
"true" width = "560" height = "497"» 
< img class = "BDE Image" src = "http: //imgsrc. baidu. com/forum/w % 3D580/sign = 35c4709bb9315c60- 
43956be7bdb0cbe6/cc223ffae6cd7b894b6be60d0a2442a7d8330eda. jpg" pic ext = "jpeg" changedsize = 
"true" width= "560" height = "497"» 


看 起 来 是 成 功 了 , 那 下 一 步 要 解决 的 问题 就 是 如 何 把 里 边 的 地 址 提取 出 来 ? 我 知道 不 少 
执行 力 比 较 强 的 谈 者 已 经 开始 动手 了 。 

等 等 ,你 ! 慢 ! 着 ! 

这 里 有 更 好 的 方法 : 


p = r'«img class = "BDE Image". * ?src - "([^"] * V. pg)". * ?>' 
其 实 就 是 将 图 片 的 地 址 用 小 括号 分 组 , 先 看 看 是 否 能 成 功 实现 : 


>>> p = r'< img class = "BDE Image". * ?src - "([^"] * V. jpg)". *?>' 
>>> imglist = re.findall(p, html) 
>>> for each in imglist: 

print(each) 


http: //imgsrc.baidu. com/forum/w % 3D580/sign = f9cf09409c25bc312b5d01906ede8de7 /8£0ede0735fa- 
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e6cdafb377ef0ab30f2443a70fda. jpg 
http://imgsrc. baidu. com/forum/w % 3D580/sign = 35c4709bb9315c6043956be7bdb0cbe6/cc223ffae6cd- 
7b894b6be60d0a2442a7d8330eda. jpg 


好 了 ,现在 告诉 你 为 什么 会 如 此 方便 。 这 是 因为 在 findall() 方 法 中 ,如 果 给 出 的 正则 表达 
式 包 含 了 一 个 或 者 多 个 子 组 ,就 会 返回 子 组 中 匹配 的 内 容 。 如 果 存 在 多 个 子 组 ,那么 它 还 会 将 
匹配 的 内 容 组 合成 元 组 的 形式 再 返回 。 

最 后 把 程序 完善 起 来 


# pl4 10.py 

import urllib. request 
import re 

import os 


def open url(url): 

req = urllib. request. Request(url) 

req. add_header( 'User - Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10 10 1) AppleWebKit/ 
537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36') 

page = urllib. request. urlopen(req) 

html = page.read().decode( 'utf - 8') 

return html 


def get img(html): 
p = r'< img class= "BDE Image". * ?src - "([^"] * V. jpg) ". * ?»' 
imglist - re.findall(p, html) 
try: 
os. mkdir("NewPics") 
except FileExistsError: 
# 如 果 该 文件 夹 已 存在 则 覆盖 保存 ! 
pass 
os. chdir("NewPics") 
for each in imglist: 
filename = each.split("/")[ - 1] 
urllib.request.urlretrieve(each, filename, None) 


if name  -- ' main ': 
url = "http://tieba. baidu. com/p/3823765471" 
get img(open url(url)) 


程序 执行 效果 如 图 14-18 所 示 。 

看 ,用 好 了 正则 表达 式 是 不 是 很 方便 \ 很 神奇 ? 不 过 findall() 方 法 有 时 候 会 让 你 感觉 很 疑 
惑 , 很 迷茫 。 举 个 例子 , 拿 出 前 边 匹 配 IP 的 正则 表达 式 , 然 后 依法 炮制 来 获取 代理 IP 地 址 : 

# pl4 11.py 


import urllib. request 
import re 


def open url(url): 
req = urllib.request. Request(url) 
req.add header('User - Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10 10 1) AppleWebKit/ 
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bie~! AHIA NewPics - O E 
-— 页 。 共享 ”吉大 EB ve 
^ Lb * NewPics v © 搜索 "Newpics" A 


“= 


2bdf888ba6lea ^ 2dofcc5c10385 2ddfeccd7b899 ^ 2e5fd0b44aed2 5a82d333c895d 8fü0ede0735íae 12f468d9f2d35 22a2e350352ac 

8d35ea8a88a92  34302b5flae96 ^ e51d989e69a47 e738aaa5aa282 143717138ad76 6cdafb377eí0a 72caf0fea538H ^ 65c4147bafdfef 

0a304e241f585f ^ 13b07ecb8088 a7d923c9950d O0lal8b86d6faa  f082025baf07d ^ b30f2442a70íd ^ 3632763d0c3f1. 2b21192138aa7 
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63ac94510fb30f 492ad3f9d72a6 25485ffbb2fb43 59119d0a304e2 170148a7d933c 867405b30f244 06328082b901 51710323dd54 

249a9d308dcd 05964523d94? 16455ca6fí425a 51fda039377a?2 8950a7944í5d4 2a70009212bd 4a901cde8733a 564e062738b7 
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da.jpg aa7 jpg jpg 9.jpg ajpg 2da jpg e06.jpg 4la? jpg 
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93312af38ida84 fcef69633cbc01 cd9e76fe8573c 00a5b69ff31b4 d4b0c299a4e87 854b6be60dO0a bf2e6a77aadb5 fb3d81eab19dc 
bd11372f001da 439017032aa7.j 012131b90e91a 3533f2838b475 025aafa50f06da 244237d8330e 7eca806438815 33c895d0430cd 
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537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36') 
page = urllib.request. urlopen(req) 
html = page.read().decode( 'utf —8') 
return html 


def get img(html): 

p = r'(([01](0,1)Nd(0, 1) Nd| 2[0 - 4]Nd| 25[0 = 51) V.) (3) ([01](0, 1] Nd(0, 1) NX d| 2[0 -4]\d| 
28[0—51)" 

imglist = re.findall(p, html) 


for each in imglist: 
print(each) 


if name  -- ' main ': 
url = "http://cn- proxy. com/" 
get img(open url(url)) 


程序 执行 后 看 到 了 奇怪 的 结果 


>>> 

(57.', 0 
('249.', '249', '126') 
('59.', '59', '104") 


这 是 因为 在 正则 表达 式 中 使 用 了 三 个 子 组 ,所 以 findallO Z A EA Jg 4R RJ] 4b A 38 f[] 30 25 
果 分 好 类 ,然后 再 返回 给 我 们 。 它 以 为 这 样 做 我 们 会 很 开心 ,我 们 也 只 能 呵呵 了 ……… 
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那 有 没有 办 法 解决 呢 ? 答案 是 肯定 有 的 ! 

要 解决 这 个 问题 ,可 以 让 子 组 不 捕获 匹配 的 内 容 。 需 要 使 用 到 扩展 语法 :(?:…), 左 小 括 
写 (() 的 后 边 紧 跟 着 问号 (?) ,这 时 候 问号 (?) 就 不 表示 匹配 前 边 内 容 堆 次 或 者 多 次 了 ,因为 它 
前 边 并 不 是 表示 重复 的 元 字符 。 所 以 聪明 的 发 明 者 把 这 样 的 组 合 认为 是 正则 表达 式 的 扩展 语 
法 。(?:…) 表 示 非 捕获 组 , 即 该 子 组 匹配 的 字符 串 无 法 从 后 边 获取 。 

姑且 试 试 看 吧 ,把 正则 表达 式 改 成 : 


p = r'(?:(?:[01]{0,1}\d{0,1}\d|2[0 - 4]Nd| 25[0 — 5])NV. ) (3) (? :[01](0, 1) Nd(0, 1] Nd] 2[0 -4]\d| 
280-3] 


4 EBD: 


>>> 

124.254. 57.150 
101.71.27.120 
122.96.59.104 


另外 还 有 一 些 比 较 实 用 的 方法 ,例如 finditer() 方 法 会 将 结果 返回 给 一 个 迭代 器 ,这 样 方 
便 你 以 迭代 的 方式 获取 ; sub() 方 法 是 实现 字符 串 的 符 换 …… 还 有 一 些 特 殊 的 语法 ,例如 前 回 
Wr a A a e e A o ,这些 大 家 都 可 以 在 文档 ( 注 : http://bbs. fishc. com/thread-57073-1-1. 
html) 中 找到 详细 的 介绍 ,这 里 就 不 再 袭 述 了 ，。 


44.6 ”异常 处 理 


wt 


高 级 语言 的 一 个 优秀 特性 就 是 提供 了 异常 处 理 机 制 ,让 程序 可 以 从 容 地 处 理 每 一 个 异常 ， 
不 至 于 因为 一 个 小 错误 而 导致 整个 程序 衣 溃 。 大 部 分 高 级 语言 处 理 错误 的 方法 都 是 通过 检测 
异常 .处 理 异常 来 实现 的 ,当然 Python 也 不 例外 。 

用 程序 进行 互联 网 访问 的 时 候 , 出 现 异 常 是 再 正常 不 过 的 事情 了 。 例 如 大 家 实现 一 个 程 
序 ,通过 几 十 个 代理 IP 实现 爬虫 操作 ,如 有 果 其 中 一 个 代理 IP 突然 不 啊 应 了 ,就 会 报错 。 这 种 
错误 触发 率 极 高 ,全 部 代理 IP 都 能 用 那 才 怪 吓 。 但 是 一 个 出 问题 并 不 会 影响 到 整个 脚本 的 任 
务 , 所 以 捕获 到 此 类 异常 的 时 候 , 直 接 忽 略 它 即 可 。 


14.6.1 URLError 


当 urlopen 无 法 处 理 一 个 啊 应 的 时 候 , 就 会 引发 URLError 异常 。 同 时 会 伴随 一 个 
reason 属性 ,用 于 包含 一 个 由 错误 编码 和 错误 信息 组 成 的 元 组 。 
下 面 ,我 们 稍微 感受 一 下 : 


>>> import urllib 
>>> req = urllib. request. Request( 'http://www. demo — fishc. com') 
>>> try: 
urllib. request. urlopen( req) 
except urllib. error. URLError as e: 


print(e. reason) 
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Bad Request 
>>> 


146.2 HTTPError 


HTTPError 是 URLError 的 子 类 ,服务 器 上 每 一 个 HTTP 的 响应 都 包含 一 个 数字 的 “ 状 
态 码 ”。 有 时 候 状 态 码 会 指出 服务 器 无 法 完成 的 请 求 类 型 ,一 般 情况 下 Python 会 帮 你 处 理 一 
部 分 这 类 响应 (例如 ,响应 的 是 一 个 “ 重 定向 ”, 要 求 客 户 端 从 别 的 地 址 来 获取 文档 ,那么 urllib 
会 自动 为 你 处 理 这 个 啊 应 ); 但 是 呢 , 有 一 些 无 法 处 理 的 ,就 会 抛 出 HTTPError 异常 。 这 些 异 
常 包括 典型 的 404( 页 面 无 法 找到 )、403( 请 求 禁 止 ) 和 401( 验 证 请 求 )。 

因为 Python 默认 会 自动 帮 你 处 理 重 定 问 方面 的 内 容 ( 状 态 码 300 一 399 范围 ) ,状态 码 
100—299 的 范围 是 表示 成 功 , 所 以 你 需要 关注 的 是 400 — 599 这 个 范围 的 状态 码 ( 因 为 它们 代 
表 响 应 出 了 问题 ) 。 其 中 ,出 现 4xx 的 状态 码 ,说 明 问 题 来 自 客户 端 ,就 是 你 自己 哪里 做 错 了 ; 
出 现 5xx 的 状态 码 , 那 就 表示 与 你 无 关 了 ,是 来 自 服 务 需 的 问题 。 

表 14-3 列举 了 常用 的 HTTP 状态 码 以 及 详细 的 含义 。 

表 14-3 常用 HTTP 状态 码 


lxx | | 这 一 类 型 的 状态 码 , 代 表 请 求 已 被 接受 ,需要 继续 处 理 
100 收 到 请 求 , 客 户 端 应 当 继续 发 送 请 求 
101 | Switching Protocols | 服务 器 通过 Upgrade 消息 头 通 知客 户 端 采用 不 同 的 协议 来 完成 这 个 请 求 


2xx 这 一 类 型 的 状态 码 ,代表 请 求 已 成 功 被 服务 器 接收 、 理 解 并 接受 
200 |OK | 请 求 已 成 功 ,请 求 的 响应 头 或 数据 体 将 随 此 响应 返回 


m rened 
URI 已 经 随 Location 头 信息 返回 
服务 器 已 接受 请 求 , 但 尚未 处 理 。 正 如 它 可 能 被 拒绝 一 样 ,最 终 该 请 求 可 
能 会 也 可 能 不 会 被 执行 
" 服务 器 已 成 功 处 理 了 请 求 , 但 返回 的 实体 头 部 元 信息 不 是 在 原始 服务 器 
Information 上 有 效 地 确定 集合 ,而 是 来 自 本 地 或 者 第 三 方 的 复制 
204 服务 器 成 功 处 理 了 请 求 ,但 没有 返回 任何 实体 内 容 


E 服务 器 成 功 处 理 了 请 求 , 且 没有 返回 任何 内 容 。 但 是 与 204 响应 不 同 , 返 
adc 回 此 状态 码 的 响应 要 求 请 求 者 重 置 文档 视图 


206 服务 器 已 经 成 功 处 理 了 部 分 GET 请 求 

这 类 状态 码 代表 需要 客户 端 采取 进一步 的 操作 才能 完成 请 求 。 通 常 ,这 
3xx | 重 定向 些 状态 码 用 来 重 定向 ,后 续 的 请 求 地 址 ( 重 定向 目标 ) 在 本 次 响应 的 
Location 域 中 指明 
被 请 求 的 资源 有 一 系列 可 供 选择 的 回馈 信息 ,每 个 都 有 自己 特定 的 地 址 
300 | Multiple Choices 和 浏览 器 驱动 的 商议 信息 。 用 户 或 浏览 器 能 够 自行 选择 一 个 首选 的 地 址 
进行 重 定向 


301 | Moved Permanent] 被 请 求 的 资源 已 永久 移动 到 新 位 置 ,并 且 将 来 任何 对 此 资源 的 引用 都 应 
oved "ermanenty | 该 使 用 本 响应 返回 的 若干 个 URI 之 一 
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状态 码 


302 


303 


304 


305 


307 


4xx 
400 
401 
402 
403 
404 
405 


2 
遇 


续 表 

说 明 
请 求 的 资源 现在 临时 从 不 同 的 URI 响 应 请 求 。 由 于 这 样 的 重 定 向 是 临时 
的 ,客户 端 应 当 继 续 向 原 有 地 址 发 送 以 后 的 请 求 
对 应 当前 请 求 的 啊 应 可 以 在 另 一 个 URI 上 被 找到 ,而且 客 户 端 应 当 采 用 
GET 的 方式 访问 那个 资源 
如 果 客 户 端 发 送 了 一 个 带 条 件 的 GET 请 求 且 该 请 求 已 被 允许 ,而 文档 的 
Not Modified 内 容 ( 自 上 次 访问 以 来 或 者 根据 请 求 的 条 件 ) 并 没有 改变 , 则 服务 器 应 当 
返回 这 个 状态 码 
被 请 求 的 资源 必须 通过 指定 的 代理 才能 被 访问 。Location 域 中 将 给 出 指 
Use Proxy 定 的 代理 所 在 的 URI 信息 ,接收 者 需要 重复 发 送 一 个 单独 的 请 求 ,通过 这 
个 代理 才能 访问 相应 资源 
请 求 的 资源 现在 临时 从 不 同 的 URI 响应 请 求 。 由 于 这 样 的 重 定 向 是 临时 
的 ,客户 端 应 当 继 续 向 原 有 地 址 发 送 以 后 的 请 求 


Found 


See Other 


Temporary Redirect 


客户 端 错 误 这 类 的 状态 码 代 表 了 客户 端 看 起 来 可 能 发 生 了 错误 ,妨碍 了 服务 器 的 处 理 
Bad Request 由 于 包含 语法 错误 ,当前 请 求 无 法 被 服务 器 理解 

Unauthorized 当前 请 求 需要 用 户 验 证 

Payment Required 该 状态 码 是 为 了 将 来 可 能 的 需求 而 预 留 的 

Forbidden 服务 器 已 经 理解 请 求 , 但 是 拒绝 执行 它 

Not Found 请 求 失败 ,请 求 的 资源 在 服务 器 上 找 不 到 


Method Not Allowed | 请 求 中 指定 的 请 求 方法 不 能 被 用 于 请 求 相 应 的 资源 


406 | Not Acceptable | 请 求 的 资源 的 内 容 特性 无 法 满足 请 求 头 中 的 条 件 ,因而 无 法 生成 响应 实体 


407 


P Authenticati 
inim ”| 与 401 状态 码 类 似 ,只 不 过 客户 端 必须 在 代理 服务 器 上 进行 身份 验证 


408 请 求 超时 。 客 户 端 没有 在 服务 器 预备 等 待 的 时 间 内 完成 一 个 请 求 的 发 送 


409 


Conflict 由 于 和 被 请 求 的 资源 的 当前 状态 之 间 存 在 冲突 ,请 求 无 法 完成 


410 被 请 求 的 资源 在 服务 器 上 已 经 不 再 可 用 ,而 且 没 有 任何 已 知 的 转发 地 址 
411 服务 器 拒绝 在 没有 定义 Content-Length 头 的 情况 下 接收 请 求 


412 


413 


414 


415 


416 


417 
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服务 器 在 验证 在 请 求 的 头 字段 中 给 出 先决 条 件 时 , 没 能 满足 其 中 的 一 个 


Precondition Failed 


或 多 个 
Request Entity 服务 器 拒绝 处 理 当 前 请 求 , 因 为 该 请 求 提 交 的 实体 数据 大 小 超过 了 服务 
Too Large 器 愿意 或 者 能 够 处 理 的 范围 
Request-URI 请 求 的 URI 长度 超 过 了 服务 器 能 够 解释 的 长 度 , 因 此 服务 器 拒绝 对 该 请 
Too Long 求 提供 服务 
Unsupported 对 于 当前 请 求 的 方法 和 所 请 求 的 资源 ,请 求 中 提交 的 实体 并 不 是 服务 器 
Media Type 中 所 支持 的 格式 ,因此 请 求 被 拒绝 


如 果 请 求 中 包含 了 Range 请 求 头 , 并 且 Range 中 指定 的 任何 数据 范围 都 
与 当前 资源 的 可 用 范围 不 重合 ,同时 请 求 中 又 没有 定义 If- Range 请 求 头 ， 
那么 服务 器 就 应 当 人 返回 416 状态 码 

在 请 求 头 Expect 中 指定 的 预期 内 容 无 法 被 服务 器 满足 ,或 者 这 个 服务 器 
Expectation Failed 是 一 个 代理 服务 器 , 它 有 明显 的 证 据 证 明 在 当前 路 由 的 下 一 个 节点 上 ， 
Expect 的 内 容 无 法 被 满足 


Requested Range Not 


Satisfiable 


£14z 论 一 只 把 虫 的 自我 修养 e 
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5xx | 服务 器 错误 这 类 状态 码 代表 了 服务 器 在 处 理 请 求 的 过 程 中 有 错误 或 者 异常 状态 发 生 
500 服务 器 遇 到 了 一 个 未 曾 预料 的 状况 ,导致 了 它 无 法 完成 对 请 求 的 处 理 
501 服务 器 不 支持 当前 请 求 所 需要 的 某 个 功能 


作为 网 关 或 者 代理 工作 的 服务 器 尝试 执行 请 求 时 ,从 上 游 服 务 器 接收 到 
502 Bad Gateway 
无 效 的 啊 应 


503 由 于 临时 的 服务 器 维护 或 者 过 载 , 服 务 器 当前 无 法 处 理 请 求 

作为 网 关 或 者 代理 工作 的 服务 器 尝试 执行 请 求 时 ,未 能 及 时 从 上 游 服 务 
504 | Gateway Timeout 器 (URI 标 识 出 的 服务 器 ,例如 HTTP、FTP、LDAP) 或 者 辅助 服务 器 ( 例 
如 DNS) 收 到 响应 


HTTP Versi 
505 服务 器 不 支持 ,或 者 拒绝 支持 在 请 求 中 使 用 的 HTTP 版 本 
Not Supported 


当 出 现 一 个 错误 的 时 候 , 服 务 需 返回 一 个 HTTP 错误 号 和 一 个 错误 页 面 。 可 以 使 用 
HTTPError 实例 作为 页 面 返回 的 啊 应 对 象 。 它 同样 也 是 拥有 像 read OO 、geturl() 和 info() 这 
类 方法 。 


>>> req = urllib.request. Request( 'http: //www. f ishc. com/demo. html') 


>>> try: 
urllib. request. urlopen(req) 
except urllib. error.HTTPError as e: 
print(e.code) 
print(e.read()) 


404 
b'«?xml version = "1.0" encoding = "ISO - 8859 - 1"?>\n <! DOCTYPE html PUBLIC " — //W3C//DTD XHTML 
1.0 Strict//EN"\n 


14.6.3 处 理 异 常 


处 理 HTTPError 或 URLRrror 异常 有 两 种 方法 。 


# pl4 12.py 
from urllib. request import Request, urlopen 
from urllib.error import URLError, HTTPError 


req - Request(someurl) 

try: 
response = urlopen(req) 

except HTTPError as e: 
print('The server couldn\'t fulfill the request. ') 
print('Error code: ', e. code) 


except URLError as e: 
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print( We failed to reach a server. ') 
print('Reason: ', e. reason) 
else: 


# everything is fine 


这 里 需要 注意 的 一 点 是 : except HTTPError 必须 在 前 边 ,因为 它 是 URLError 的 子 类 。 
所 以 如 果 把 except URLError 放 前 边 ,就 会 把 HTTPError 的 内 容 过 滤 掉 本。 
第 二 种 写法 是 像 这 样 : 


# pl4 13.py 
from urllib. request import Request, urlopen 
from urllib. error import URLError 


req = Request(someurl) 
try: 
response = urlopen(req) 
except URLError as e: 
if hasattr(e, 'reason'): 
print( We failed to reach a server. ') 
print( Reason: ', e.reason) 
elif hasattr(e, 'code'): 
print('The server couldn\'t fulfill the request. ') 
print(' Error code: ', e. code) 
else: 


# everything is fine 


虽然 两 种 写法 都 可 以 实现 ,但 比较 推荐 第 二 种 写法 。 


44.7 CX Scrapy 
mt 


说 到 Python 疏 虫 “大 牛 们 ”都 会 不 约 而 同 地 提起 “西瓜 皮 ”(Scrapy)。 因 为 Scrapy 是 一 
个 为 了 候 取 网 站 数据 、 提 取 结 构 性 数据 而 编写 的 应 用 框架 ,可 以 应 用 在 包括 数据 挖 据 、 信 息 处 
理 或 存储 历史 数据 等 一 系列 的 程序 中 。 

Scrapy 最 初 是 为 了 页 面 抓 取 ( 更 确切 地 说 ,是 网 络 抓 取 ) 所 设计 的 ,也 可 以 应 用 在 获取 
API 所 返回 的 数据 (例如 Amazon Associates Web Services) 2X zi 388 JH EH PI 255 (B 1B. 

由 于 Scrapy 目前 不 支持 Python3 ,因此 需要 安装 Python2. 7 来 使 用 Scrapy。 不 过 不 用 提 
心 ,Python2.7 和 Python3 是 可 以 共存 的 (如 果 出 现 “ 兼 容 性 ”问题 ,请 查看 : http://bbs. fishc. 
com/thread-58701-1-1. html) 。 

安装 步骤 (Windows 下 所 需要 的 安装 包 均 已 提供 , 详 见 “安装 Scrapy 所 需要 的 软件 . zip”) : 

(D 安装 Python2. 7(32 位 版 本 ) ,地址 为 https://www. python. org/downloads/release/ 
python-279/ , 

(2) 打开 运行 ?对 话 杠 ,输入 cmd。 执 行 以 下 命令 ,设置 环境 变量 : 


C:\Python27\python. exe C:\Python27\tools\Scripts\win add2path. py 
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(3) 重新 输入 cmd, 执 行 命令 C: NVPython27N python. exe--version, 如果 显 示 Python2. 7. 
9, 则 说 明成 功 ; 如 果 没 有 显示 ,请 服用 Windows" 特效 药 ” 一 一 重启 系统 尝试 一 下 。 

(4) 安装 pywin32(32 位 版 本 ) ,地址 为 http://sourceforge. net/projects/pywin32/ 。 

(5) "EX pip ,地址 为 https://pip. pypa. i0/en/latest/installing. html, 

(D PA get-pip. py. 

(2 进入 cmd ,执行 命令 python get-pip. py. 

重要 提示 : 如 果 你 的 用 户 名 是 中 文 , 那 么 执行 上 面 操作 会 报 编码 错误 ,请 在 python 目录 
(Python27\Lib\site-packages) 中 新 建 一 个 文件 sitecustomize. py. 

内 容 如 下 : 

import sys 

Sys. setdefaultencoding( 'gb2312') 

© 检查 Python27\Scripts 中 是 否 有 pip. exe 并 设置 Python27 Scripts 到 环境 变量 中 。 

(D 重启 cmd, 输 入 命令 “pip 一 version”, 如果 显 示 版 本 号 , 则 说 明成 功 ; 如 果 没 有 显示 ,请 
继续 服用 Windows" 特效 药 " 一 一 重 司 系统 答 试 一 下 。 

pip 实际 上 就 是 Python 的 一 个 安装 软件 的 工具 ,有 了 它 就 可 以 轻松 便捷 地 安装 各 种 
Python 的 模块 了 。 离 我 们 的 目标 不 远 了 , 接 下 来 还 需要 lxml 和 pyOpenSSL 。 

(6) 虽然 可 以 用 pip 安装 lxml, 但 如 果 你 使 用 的 是 Windows 系统 , 则 建议 不 要 ,因为 lxml 
有 很 多 依赖 的 软件 ,其 他 系统 都 是 自 带 的 ,但 Windows 没有 ,所 以 还 是 老 老实 实 使 用 lxml 专 
门 为 Windows 提供 的 安装 包 来 安装 吧 。 

C) 接 下 来 使 用 pip 来 安装 pyOpenSSL, 需 要 说 明 的 是 ,OpenSSL 一 般 在 其 他 系统 也 是 
有 了 预 安 狐 的 ,除了 Windows: 来 ,pip 走 起 : 


C:\ > pip install pyOpenSSL 

重要 提示 : 这 里 pip 需要 微软 的 VS2008 的 C 语言 编译 项 ,所 以 如 果 没 有 安装 VS2008 或 
者 你 的 VS 版 本 太 高 ,也 是 不 行 的 。 可 以 安装 微软 为 Python 开发 的 : VCForPython27. msi, 

(8) 最 后 一 步 , 使 用 pip 安装 我 们 的 主角 Scrapy: 

pip install Scrapy 

(9) Ja li fefe . 


C:\ > Scrapy:0: UserWarning: You do not have a working installation of the service identity 
module: 'No module named service identity'. Please install it from < https: //pyp 

i. python.org/pypi/service identity» and make sure all of its dependencies are sa 

tisfied. Without the service identity module and a recent enough pyOpenSSL to s 

upport it, Twisted can perform only rudimentary TLS client hostname verification 

. Many valid certificate/hostname mappings may be rejected. 


(100 虽然 没有 报错 ,但 有 一 个 提醒 需要 处 理 , 即 提示 我 们 需要 安装 service identity. fi T 
pip ,安装 模块 就 太 简 单 了 : 


C:\ > pip install service identity 


(11) 搞定 ,如 图 14-19 所 示 。 
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C:\windows\system32\cmd.exe 一 
:\>pip --uersion 
pip 6.8.8 from C:XPuython27X1libXsite-packages (python 2.7) 


;: M» Scrapu 
8.25.4 - no active project 


scrapy «command» [options] [args] 


Available commands: 
bench Run quick benchmark test 
Fetch Fetch a URL using the Scrapy downloader 
runspider Run a self-contained spider (without creating a project) 
settings Get settings values 
shell Interactiue scraping console 
startproject Create neu project 
version Print Scrapy version 
Uleu Open URL in browser, as seen by Scrapy 


[ more ] More commands available when run from project directory 


se "scrapy «command» -h" to see more info about a command 


图 14-19  Scrapy 的 安装 
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AERA ul BB SEE: “MARINE f Python j 5 SERRI . 3p 32 x 1- Pri f) 
Je AR UR EAD TT 

其 实 懂得 用 Python 5 ERARIS ,就 像 你 懂 武 功 会 打架 ,但 行军 打仗 你 不 行 , 毕 竞 和 天 人 是 
T 军 万 马 ,纵使 你 再 强 ,也 只 能 是 百人 敌 ,要 成 为 万 人 敌 ,你 要 学 的 就 是 排 兵 布 阵 ,运筹 帷 帷 。 
所 以 Scrapy 就 是 Python f& ( 5" 43-5 1E" , 

使 用 Scrapy 抓 取 一 个 网 站 一 共 需 要 四 个 步骤 : 

(D 创建 一 个 Scrapy MH ; 

(2) 定义 Item RAR; 

(3) 编写 爬虫 ; 

(4) 存储 内 容 。 


14.8.1 Scrapy 框架 


学 习 怎 么 使 用 Scrapy 之 前 ,需要 先 来 了 解 一 下 Scrapy 的 架构 以 及 组 件 之 间 的 交互 。 
图 14-20 展现 的 是 Scrapy 的 架构 ,包括 组 件 及 在 系统 中 发 生 的 数据 流 ( 图 中 箭头 指示 ) 。 


1. Scrapy Engine 


Scrapy 引擎 是 爬虫 工作 的 核心 ,负责 控制 数据 流 在 系统 中 所 有 组 件 中 流动 ,并 在 相应 动 
作 发 生 时 触发 事件 。 


" 196 o 


t liz ” 论 一 只 把 虫 的 自我 修养 JM 


Requests 


Aw 
LULL 


Downloader 
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Engine 
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图 14-20 Scrapy 架构 


2. 调度 器 


Js BE di C Scheduler) M 5| SE 222. request 并 将 它们 入 队 , 以 便 之 后 引擎 请 求 它 们 时 提供 给 
引擎 。 


3. THA 
FX: Downloader) 负责 获取 页 面 数 据 并 提供 给 引擎 ,而 后 提供 给 Spider, 
4. Spiders 


Spider 是 Scrapy 用 户 编 写 用 于 分 析 由 下 载 需 返回 的 response, 并 提取 出 item 和 额外 跟 进 
的 URL 的 类 。 


5. Item Pipeline 


Item Pipeline 负责 处 理 被 Spider 提取 出 来 的 item。 典 型 的 处 理 有 清理 、 验 证 及 持久 化 
(例如 , 存 取 到 数据 库 中 )。 

接 下 来 是 两 个 中 间 件 ,它们 用 于 提供 一 个 简便 的 机 制 , 通 过 插入 自 定 义 代 码 来 扩展 
Scrapy 的 功能 。 


6. 下 载 器 中 间 件 


FA ug TFCODownloader middlewares) 是 在 引擎 及 下 载 需 之 间 的 特定 钩子 (specific 
hook) ,处 理 Downloader 传递 给 引擎 的 response, 
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7. Spider 中 间 件 


Spider 中 间 件 (Spider middlewares) 是 在 引擎 及 Spider ZZ [B] IJ PE f F specific hook), 
处 理 spider 的 输入 (就 是 接收 来 自 下 载 堪 的 response) 和 输出 (就 是 发 送 items 给 item pipeline 
以 及 发 送 requests 25 Ws] FE 8) 。 

下 面 给 大 家 从 头 到 尾 演示 一 过 : 

抓 取 dmoz. org 网 站 有 关 Python 的 Books(http://www. dmoz. org/ Computers/ Programming/ 
Languages/ Python/ Books/) 和 Resources (http://www. dmoz. org/Computers/Programming/ 
Languages/Python/Resources/ ) 9t ii , 

DMOZ 网 站 是 一 个 著名 的 开放 式 分 类 目录 (Open Directory Project) ,之 所 以 称 为 开放 式 
分 类 目录 ,是 因为 DMOZ 不 同 于 一 般 分 类 导航 网 站 。DMOZ 中 的 所 有 内 容 虱 是 由 来 日 世界 
各 地 的 志愿 者 共同 维护 与 建设 的 ,目前 DMOZ 是 互联 网 上 最 大 的 、 最 广泛 的 人 工 目 录 。 那 就 
拿 它 来 练 练 手 ,看 Scrapy 是 否 能 胜任 。 


14.8.2 创建 一 个 Scrapy m A 
在 开始 息 取 之 前 ,需要 先 创建 一 个 新 的 Scrapy 项 目 , 并 进入 打算 存储 代码 的 目录 中 ,运行 


下 列 命令 : 
C:\ > scrapy startproject tutoria 
该 命令 将 会 创建 包含 下 列 内 容 的 tutorial 目录 : 


tutorial/ 

scrapy. cfg 

tutorial/ 
| init .py 
items. py 
pipelines.py 
settings.py 
spiders/ 

| | init .py 


这 些 文件 构成 了 Scrapy ME dije 28 , 

* scrapy. cfg: 项 目的 配置 文件 。 

e tutorial/ : 该 项 目的 python 模块 ,之 后 将 在 此 加 入 代码 。 
e tutorial/items. py: M H P HJ item 文件 。 
tutorial/pipelines. py; 项 目 中 的 pipelines 文件 。 

。 tutorial/settings. py: 项 目的 设置 文件 。 

。 tutorial/spiders/: 放置 spider 代码 的 目录 。 


14.8.3 定义 Item Z dà 


Item Jé fi f£ f BC HS 23646 P5 A i . HAE 75 1 II python 字典 类 似 , 并 且 提 供 了 额外 保护 
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机 制 来 避免 因 拼 写 错误 导致 的 未 定义 字段 错误 。 

首先 根据 需要 从 dmoz. org 获取 到 的 数据 对 item 进行 建 横 。 例 如 需要 从 dmoz 中 获取 名 
Furl 网 址 以 及 网 站 的 描述 。 对 此 ,需要 在 item 中 和 定义 相应 的 字段 。 

编辑 tutorial 目录 中 的 items. py 文件 : 


import scrapy 


class DmozItem(scrapy. Item): 
title = scrapy.Field() 
link = scrapy.Field() 
desc = scrapy.Field() 
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He FRE hi SERŽ Spider. Spider Ze JH JP! 28 5 FH FA Fd i: Efe UB n 25 。 
其 包含 了 一 个 用 于 下 载 的 初始 URL ,然后 是 如 何 跟 进 网 页 中 的 链接 以 及 如 何 分 析 页 面 中 
的 内 容 , 还 有 提取 生成 item 的 方法 。 
创建 一 个 自 定义 的 Spider 时 ,必须 继承 scrapy. Spider 类 , 晶 定 义 以 下 三 个 属性 . 
用 于 区 别 不 同 的 Spider。 该 名 字 必 须 是 唯一 的 ,不 可 以 为 不 同 的 Spider i 
定 相 同 的 名 字 。 
* start urls 包含 了 Spider FJa aj Hy] ETT ERO url 列表 。 因 此 ,第 一 个 被 获取 到 的 
页 面 将 是 其 中 之 一 。 后 续 的 URL 则 从 初始 的 URL 获取 到 的 数据 中 提取 。 
e parse() 一 一 是 spider If] — ^P [BE JS] PR C. 24 F d a8 3x [el Response 的 时 候 , 该 困 数 就 会 
被 调用 ,每 个 初始 URL 完成 下 载 后 生成 的 Response 对 象 将 会 作为 唯一 的 参数 传递 给 
该 函数 。 该 方法 负责 解析 返回 的 数据 (response data) ,提取 数据 (生成 item) 以 及 生成 
需要 进一步 处 理 的 URL 的 Request 对 象 。 
以 下 的 Spider 代码 保存 在 tutorial/spiders 目录 下 的 dmoz spider. py 文件 中 : 


* name 


import scrapy 


class DmozSpider(scrapy. Spider): 
name - "dmoz" 
allowed domains = ["dmoz.org"] 
start urls = [ 
"http://www. dmoz. org/Computers/Programming/Languages/Python/Books/" , 
"http://www. dmoz. org/Computers/Programming/Languages/Python/Resources/" 
] 


def parse(self, response): 
filename = response. url.split("/")[ - 2] 
with open(filename, 'wb') as f: 
f.write(response. body) 


14.8.5 JE 
通过 命令 行进 入 tutorial 项 目的 根 目 录 : 
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C:\ > cd tutorial 

然后 执行 下 列 命令 启动 spider: 

C:\ > scrapy crawl dmoz 

crawl dmoz 启动 用 于 有 息 取 dmoz. org 的 spider, 将 得 到 类 似 的 输出 ,如 图 14-21 所 示 。 


2015-02-28 23:31:37*0800 [scrapy] INFO: Scrapy 0.25.4 started (bot: tutorial) 
2015-02-28 23:31:37*0800 [scrapu] INFO: Optional features available: ssl, http11 


2015-02-28 23:31:37+0800 [scrapy] INFO: Ouerridden settings: ('NEUSPIDER, MODULE ' 
'tutorial.spiders', 'SPIDER, MODULES': ['tutorial.spiders'], 'BOT, NRAME': 'tutor 
ial') 
2015-02-28 23:31:37*0800 [scrapu] INFO: Enabled extensions: LoogStats, TelnetCons 
ole, CloseSpider, lWebSeruice, CoreStats, SpiderState 
2015-02-28 23:31:37*0800 [scrapy] INFO: Enabled downloader middlewares: HttpAuth 
Middleware, DounloadTimeoutMiddleware, UserfügentMiddleware, RetruMiddleware, Def 
aultHeadersMiddleware, MetaRefreshMiddleware, HttpCompressionMiddleware, Redirec 
tMiddleuare, CookiesMiddleware, ChunkedTransferMiddleware, DownloaderStats 
2015-02-28 23:31:3T7*0800 [scrapy] INFO: Enabled spider middlewares: HttpErrorMid 
dleware, OffsiteMiddleware, RefererHMiddleware, UrlLengthMiddleware, DepthMiddlew 


:31:37+0800 [scrapy] INFO: Enabled item pipelines: 

:31:37+0800 [dmoz] INFO: Spider opened 

:31:37+0800 [dmoz] INFO: Crawled © pages (at 8 pages/min), scraped 
O items (at O items/min) 
2015-02-28 23:31:371*0888 [scrapy] DEBUG: Telnet console listening on 127.0.0.1:6 
023 
2015-02-28 23:31:37*0800 [scrapy] DEBUG: Web service listening on 127.0.0.1:6080 


2015-02-28 23:31:38*0800 [dmoz] DEBUG: Crawled (200) «GET http: //www.dmoz .org/Co 
nputers/Programning/Languages/Puython/Resources/» (referer: None) 
2015-02-28 23:31:38*0880 [dmoz] DEBUG: Crawled (280) «GET http: //www.dmoz.orog/Co 
nputers/Programming/Languages/Puthon/Books/» (referer: None) 
2015-02-28 23:31:38*0800 [dmoz] INFO: Closing spider (finished) 
2015-02-28 23:31:38*0880 [dmoz] INFO: Dumping Scrapy stats: 
( dounloader/request buytes': 516, 
 downloader/request, count': 2, 
 downloeader/request method, count/GET ': 2, 
 downloader/response bytes : 1632, 
'downloader/response count': 2, 
 dounloader/response, status, count/200': 2, 
"finish reason': 'finished', 
'finish time': datetime.datetime(2015, 2, 28, 15, 31, 38, 475000), 
"log, count/DEBUG : M, 
'log count/INFO': f, 
'response, receiued count': 2, 
'scheduler/dequeued': 2, 
'scheduler/dequeued/memoruy': 2, 
'scheduler/enqueued': 2, 
'scheduler/enqueued/memoru': 2, 
'start time': datetime.datetime(2015, 2, 28, 15, 31, 37, 4819000)} 
2015-02-28 23:31:38*0800 [dmoz] INFO: Spider closed (finished) 


图 14-21 Scrapy EZDAI] C—) 
查看 包含 | dmoz 的 输出 ,可 以 看 到 输出 的 日 志 中 包含 定义 在 start. urls 的 初始 URL ,并 
H 5 spider 中 是 一 一 对 应 的 。 在 日 志 中 可 以 看 到 其 没有 指 问 其 他 页 面 ( (referer: None)? ) 。 
除 此 之 外 ,更 有 趣 的 事情 发 生 了 。 就 像 parse() 了 函数 中 指定 的 那样 ,有 两 个 包含 URL 所 
对 应 的 内 容 的 文件 被 创建 出 来 : Book 和 Resources, 如 图 14-22 所 示 。 
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名 称 修改 日 期 类 型 大 小 \ 


l, tutorial 2/28, 星期 六 23:31 ”文件 夹 
| Books 2/28, 星期 六 23:31 文件 


] Resources 2/28, 星期 六 23:31 “文件 
| scrapy.cfg 2/28, 88H37. 23:05 CFG 文件 


图 14-22 Scrapy 框架 之 初 守门 径 ( 二 ) 


刚才 发 生 了 什么 ? 

Scrapy 为 Spider 的 start. urls 属性 中 每 个 URL 创建 了 Request 对 象 , 并 将 parseO 7r i 
Ji xE 2g [el 38 PR C, Request 对 象 经 过 调度 ,执行 下 载 器 并 生成 Response 对 象 反 馈 回 
Spider 类 。 
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f& 5c d& ^ d vt. Be TREMER E S. KAZARA ELH item tam? 取 就 是 这 
么 一 个 大 浪 淘 沙 的 过 程 一 一 从 得 到 的 网 页 内 容 提 取出 我 们 需要 的 数据 。 

之 前 教 大 家 是 使 用 正则 表达 式 ,在 Scrapy 中 是 使 用 一 种 基于 XPath 和 CSS 的 表达 式 机 
Wl: Scrapy Selectors, 

Selector 是 一 个 选择 大 , 它 有 四 个 基本 方法 : 

(1) xpath () 一 一 传人 xpath 表达 式 , 人 返回 该 表达 式 所 对 应 的 所 有 节点 的 selector list 
列表 。 

(2) css() 一 一 传人 CSS 表达 式 , 返 回 该 表达 式 所 对 应 的 所 有 节点 的 selector list 列表 。 

(3) extract() 一 一 序列 化 该 节点 为 unicode 字符 串 并 返回 list, 

(4) re() 一 一 根据 传人 的 正则 表达 式 对 数据 进行 提取 ,返回 unicode 字符 串 list 列表 。 


14.8.7 在 Shell 中 尝试 Selector 选择 器 


为 了 介绍 Selector 的 使 用 方法 , 接 下 来 将 要 使 用 内 置 的 Scrapy shell。 你 需要 先进 入 项 目 
的 根 目录 ,执行 下 列 命令 来 启动 Scrapy shell: 

C:\ > scrapy shell 

"http://www. dmoz. org/Computers/Programming/Languages/Python/Books/" 

shell 的 输出 如 图 14-23 所 示 。 

在 Shell RAJA ,你 将 获得 response 回应 ,存储 在 本 地 变量 response 中 。 

所 以 如 果 输 入 response. body, 你 将 会 看 到 response 的 body 部 分 ,也 就 是 抓 取 到 的 页 面 
内 容 , 如 图 14-24 所 示 。 

或 者 输入 response. headers 来 查看 它 的 header 部 分 ,如 图 14-25 所 示 。 

现在 就 像 是 一 大 堆 沙 子 握 在 手 里 ,里 面 有 我 们 想 要 的 金子 ,所 以 下 一 步 就 要 用 入 子 把 沙子 
去 掉 , 淘 出 金子 。selector 选择 需 就 是 这 样 一 个 筛子 ,正如 刚才 讲 到 的 ,你 可 以 使 用 response. 
selector. xpath() ,response. selector. css() , response. selector. extract() 和 response. selector. reC) 这 


四 个 基本 方法 。 
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2015-02-28 23:38:43*0800 [scrapy] INFO: Scrapu 0.24.4 started (bot: tutorial) 
2015-02-28 23:38:43*0800 [scrapy] INFO: Optional features available: ssl, http1l 


2015-02-28 23:38:43*0800 [scrapy] INFO: Ouerridden settings: ( 'NEUSPIDER, MODULE ' 
"'tutorial.spiders', 'SPIDER MODULES': ['tutorial.spiders'], 'LOGSTARTS, INTERURL 

': O, 'BOT, NAaME': 'tutorial') 

2015-02-28 23:38:43*0800 [scrapy] INFO: Enabled extensions: TelnetConsole, Close 

Spider, WebService, CoreStats, SpiderState 

2015-02-28 23:38:44*0800 [scrapy] INFO: Enabled downloader middlewares: HttpAuth 
iddleware, DownloadTimeoutMiddleware, UserügentMiddleware, RetruMiddleware, Def 
|aultHeadersMiddleuare, MetaRefreshMiddleware, HttpCompressionMiddleware, Redirec 
tMiddleware, CookiesMiddleware, ChunkedTransferMiddleware, DownloaderStats 

2015-02-28 23:38:44+0800 [scrapy] INFO: Enabled spider middleuares: HttpErrorMid 
dleware, OffsiteMiddleware, RefererMiddleware, UrlLengthMiddleuare, DepthMiddlew 
are 

2015-02-28 23:38:44*0880 [scrapy] INFO: Enabled item pipelines: 

015-02-28 23:38:44+0800 [scrapy] DEBUG: Telnet console listening on 127.0.0.1:6 


015-02-28 23:38:45*0800 [scrapy] DEBUG: Web service listening on 127.8.0.1:6080 


[dmoz] INFO: Spider opened 
[dmoz] DEBUG: Crawled (200) «GET http: //uuw.dmoz.org/Co 
puters/Programming/Languages/Puython/Books/» (referer: None) 
[s] Available Scrapy objects: 
crawler «scrapy.crawler.Crawler object at 0x03A73370> 
item O 
request «GET http: //www.dmoz .org/Computers/Programming/Languages/Puython 


response «200 http: //WWM.dmoz .org/Computers/Programming/Languages /Puthon 
Books/» 
settings  «scrapu.settings.Settinos object at 0x037517B0» 
spider «DmozSpider 'dmoz' at 0x3d75a70> 
[s] Useful shortcuts: 
[s]  shelp() Shell help (print this help) 
fetch(req or url) Fetch request (or URL) and update local objects 
uiew(response) Uiew response in a browser 


图 14-23 在 Shell PŽ Selector Xt f£ $6 (— ) 


-"faq"))?"dmoz report abuse system faq":"dmoz report abuse sustem";e-1)Jelse[if(t 
z::z:"Fdf.dmoz.org )(R-:"utilities";u-"rdf";j-"leuel-8";if((Dz::0)&&(d--:" - "))(h- 


&(d'!zz" - "))(h*"rdf - "*d)))ez1)JJif(e!-*1) (if((cz**"cgi-bin")&&(t!'-- "search.d 
oz.org"))(R-"utilities";jz"leuel-0";switch(d)(case" apply":case"forgot":y- "edito 
s":h:(dszzz"forgot")?"editors - password reminder form":(s, 265.getQueruParam( "sub 
:::0)?"editors - application info":"editors - application'";e-:1;brea 

;case" add" :case" update" :case"update2":case"update3" :case"reinstate":y- editors"; 
if(d:2:"add")(hs" "editors ~ submit a site instructions" )else(if(d::-"update")(hs" 
editors - update listing instructions"jelse([if(dz--"update2")(hz"editors - updat 
e listing form" Jelse(if(d*-*"update3" )(h-*" "editors - update listing form received 
"Jelse(if(dzz-"reinstate")(hz"editors - account reinstatement form receiued")))) 
Je-1;break;case"send":case"send2" :y- "editors" ;h-(d--:-"send")?"send editors feed 
ack'":"editors feedback receiued":e-z1;break)))ifí(e!-z-z1)(if((kz--2" "desc.html")llík- 
zz"faq.htm1"))(uz(kzzz"desc.htm1")?"description":"faq";hz(Dzz:-z1)?"branch catego 
":(D**:2)?"branch subcategory ":"branch leuel-"*D*" ":h:h*wu))s 265.trackExter 
alLinks-false;s, 265.mmxgo-true;s, 265.prop1-z8;s, 265.prop2-u;s, 265.prop1T1:j:s, 265. 
pageName-h;s, 265.t()))()))var s, account- "aoldmozodp,aolsuc";(function()(uar b=do 
ument,azb.createElement("script" );a.tuype-"text/jauascript";a.src:(location.prot 
0col---"https:"?"https://s":"http://o") *". aolcdn.com/omniunih.js";b.getElementsB 
TagName( "head") [60] . appendChild(8))());MrMXn&/script»XrXnc/diu»NrNn& /body»NrNn&/ 


图 14-24 在 Shell 中 尝试 Selector 选择 器 (二 ) 


>>> response.headers 
('Cteonnt-Length': ['33399'], 'Content-Language': ['en'], 'Set-Cookie': ['JSESSI 
ONID:68B46698711C0099Q04EU4ESCEFE408EC6; Pathz/'], 'Seruer': ['Apache'], 'Date': [ 


"Sat, 28 Feb 2015 15:41:14 GMT']. 'Content-Type': ['text/htm1;charset-UTF-8']] 
>>> 


图 14-25 Æ Shell "P ZEiX Selector 选择 器 (三 ) 


&£14z i— nmmitauts M 


14.8.8 使 用 XPath 


什么 是 XPath? 

XPath 是 一 门 在 网 页 中 查找 特定 信息 的 语言 。 了 所 以 用 XPath 来 遇 选 数据 ,要 比 使 用 正则 
AGUA) ES, 

下 面 是 XPath 表达 式 的 例子 及 对 应 的 含义 : 
选择 HTML 文档 中 一 head 二 标签 内 的 过 title 二 元 系 。 

e /html/head/title/text O —— 3X f£ E ifi £i $1 85 — title 76 2& HJ OCA. 

。 //1d— EnA B — td 2603. 

e //div| (G$ class— "mine" | 一 一 选择 所 有 具有 class— "mine" jR TES div 元 素 。 

上 面 仅仅 是 几 个 简单 的 XPath 例子 ,实际 上 XPath 要 强大 得 多 。 如 果 你 想 了 解 更 多 关于 
XPath 的 内 容 , 推 荐 学 习 这 篇 文章 http://www. w3school. com. cen/xpath/ 。 


e /html/head/title 


值得 一 提 的 是 ,response. xpath () , response. css() 已 经 被 映射 到 response. selector. xpath O , 
response. selector. css() ,所 以 直接 使 用 response. xpath() 即 可 ,如 图 14-26 所 示 。 


>>> response.xpath( '//title') 

[XSelector xpath-'//title' data-u'«title»DMOZ - Computers: Programming: La'»] 
>>> response .xpath( ' //title').extract() 

[u'«title»DMOZ - Computers: Programming: Languages: Python: Booksí/title»'] 

>>> response .xpathí( ' //title/text()') 

[XSelector xpath-'//title/text()' data-u'DM0Z2 - Computers: Programming: Language 


$'»] 

>>> response.xpath( '//title/text() ').extract() 

[u'DMOZ - Computers: Programming: Languages: Python: Books'] 
>>> response.xpath( '//title/text() ').re( '(Xw*t): ') 
[u'Computers', u'Programming', u'Languages', u'Python'] 

>>? 


图 14-26 使 用 XPath 


14.8.9 提取 数据 


接 下 来 尝试 从 这 些 页 面 中 提取 一 些 有 用 的 数据 。 当 然 你 可 以 通过 输入 response. body 来 
观察 HTML 源码 并 确定 XPath 表达 式 。 不 过 这 里 不 建议 你 这 么 做 ,因为 这 样 做 太 麻 烦 了 
你 完全 可 以 利用 谷歌 浏览 需 的 "审核 元 素 " 功 能 来 观察 (就 像 以 前 踩点 的 时 候 所 做 的 一 样 ) 。 

根据 item 中 定义 的 ,需要 找到 ( 书 的 ) 名 字 、URL 网 址 以 及 网 站 的 描述 。 要 找 出 它们 的 规 
律 ,然后 通过 XPath ee 来 ,如 图 14-27 m 


发 现 需 要 的 东西 都 在 一 “</ul> Aic 每 对 一 > 标签 包含 一 组 我 们 需要 的 
信息 。 因 此 ,可 di 3k iX > 标签 (shell icd, response 的 类 型 月 动 为 我 们 初 


始 化 了 变量 sel, 可 以 直接 使 用 ) : 
sel. xpath( '//ul/li') 
二 标签 中 ,可 以 这 样 捕获 网 站 的 描述 ,并 用 列表 返回 : 
sel. xpath( '//ul/li/text()').extract() 


可 以 这 样 捕获 网 站 的 标题 


«i 


FEMA Python 


* Core Python Programming - By Wesley J. Chin; Preurice Hall PTR, 2001, ISBN 0130250363. For experienced developers to improve extant skills: professional level examples. Starts by introducing ayatax, obje 
built-ins. [Prentice Hall] wS 4 

^. 

* Data Structures and Algorithms with«QbjectyOriented Design Patterns in Python - The primary goal of this boo is to promote object-oriented design using Python and to illustrate the use of the emerging 
meondary goal ofthe hank ia ta peenent mathèmatigal tanla mat in time. Analynin techniques and proofn ars prenented as nezded and in the proper context. 


* Dive Into Python 3 - By Mark Pilgrim, Guide to Python 3 and its differences from Python 2. Each chaptar starts with a real code sample and explains it fully. Has a comprehensive appendix of all the syntactic and 


Y ~ 
* Foundations of Python Network Proerammind - This Doek covers a wide range of topics. From raw TCP anc UDP to encryption with TSL, and then to IITTP, SMTP, POP, IMAP., and ssh. It gives you a good 
everything on the network with Python. 


* Free Python books - Free Python books and tutorials 


Thorough, in-depth approach to many basic and inrermádiate programming topics. Full text oníire.gnd downloads: HTML, PDF. PS, LaTeX. [Free, Green Tea Press] 
* An Introduction to Python - By Guido van Roesum, Fred L. Drake, Jr.: Network Theory Ltd.. 2001 Y&8N 0954161769. Printed edition of official tutorial for v2.x. from Python.org. [Network Theory. online] 
* Learn to Progran Using Python - Hook by Alan Gaid with Sul text online. lnnroduction for those lear ning pe gt amming basics: terminology, concepts. methods to write code. Assumes no price knowkedge but b 


| 
~ 日 Elements. Network Sources Timeline Profiles 3esoumPs Audit Console 
wd a 123-47 div> 


iv Llass-"mevigste" sl 
l "clear”y</divy 


E Ftieldcsap^s.6/t1eldsel? | 

t class-"fleldcap fieldcapN"» «c/fieldse- 
Lope | 
é 2 lass-" fleidcap > 


s-"dirc e€-"margin-lef*t:9; 


图 14-27 提取 数据 (一 ) 
sel. xpath( '//ul/li/a/text()').extract() 
以 及 网 站 的 链接 : 


sel. xpath( '//ul/li/a/(Qhref').extract() 


个 循环 来 打印 需要 的 信息 : 


>>> sites = sel.xpath( //ul/li') 

>>> for site in sites: 
title = site. xpath( 'a/text() '). extract() 
link = site.xpath( a/(Qhref'). extract() 
desc = site.xpath( text() '). extract() 
print(title, link, desc) 


实现 结果 如 图 14-28 所 示 。 


([u'Top'], [u'7/], [u'NrNnNrn 'D 
([u'Computers'], [u'/Computers/'], []) 
([u'Programming'], [u'/Computers/Prooramming/'], []) 
([u'Languages'], [u'/Computers/Prooramming/Languages/']. []) 
([u'Python'], [u'/Computers/Programming/Languages/Puthon/']. []) 
([], HELM ', u'Wxa8', u'Nr^n 
] 
([u'Computers: Programming: Languages: Python: Resources'], [u'/Computers/Progra 
mmino/Languages/Puthon/Resources/'], [u'XrXn ', U' \r\n 
', U'Nr^n 1) 
([u'Computers: Programming: Languages: Ruby: Books'], [u'/Computers/Programming/ 
Languages/Ruby/Books/'], [u'NrXn ', M' \r\n 
', uU'NrAn ]J) 
([u'Deutsch']. [u'/World/Deutsch/Computer/Programmieren/Sprachen/Puthon/BZC3ABCc 
her ] ，[u Fn Mt ，U NMFAn ", U'NrAn 
:] 


图 14-28 提取 数据 (二 ) 


t 


注意 ,如 果 这 里 不 加 extractO ,xpath() 是 直接 返回 一 个 Selector 对 象 组 成 的 列表 。: 


产 


Jj 一 


但 是 结果 不 对 , 它 怎 么 把 Top, Computers, Programming 这 些 导 航 栏 中 的 内 容 也 给 打印 


出 来 啦 ? 查看 “审查 元 素 ”, 原 来 导航 栏 也 是 由 二 ul 二 二 li 二 标签 组 成 的 ,如 图 14-29 所 示 。 
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| | 


(fop) Computers: Programming: Languages: Python: Books (22) 


a ("nero Buthan Droorammine Be Waals: T (The: Deantiaa Hall DTD 2001 ICTERN 0130260363. For experienced developers to 
www.dmoz.org 


Q g i Network Sources Timeline Profiles Resources Audits Console 


< IDOCITYPE html» 
Y «html langz"ek"» 
> «head»..c/heal» 
Y «body dir-"LT" data-twttr-rendered-"true"» 
b «div class-Anone"»..«/div» 
Y «div id-"docY class-"nodViewN"» 
= <div id="hd style-"border-bottom:0; "»..«/div? 
b «div id-"hdlbar"»..«/díiv» 
Y «div id-"bd-kross"» 
> «form classe"center mblem" action-"/search" method-"get"»..«/form» 
Y «div class-Anavigate" style» 
= «di a = 证" >.< /div> 
«ul class-"navigate"» 
Y «li class-"first"» 
«a href-"/"»Top«/a» 


b <li>...</li> 
b <li>...</li> 
b <li>...</li> 
P c1i».«/1li» 
Pb <li class-"last"».«/1i» 


图 14-29 ”提取 数据 (三 ) 
此 时 ,进一步 设置 ul 的 属性 即 可 : 


>>> sites = sel. xpath('//ul[ @class = "directory - url" ]/li') 
>>> for site in sites: 

title = site. xpath( 'a/text() '). extract() 

link = site. xpath( 'a/(Qhref'). extract() 

desc = site.xpath( text() '). extract() 

print(title, link, desc) 


实现 如 图 14-30 所 示 。 
这 就 是 我 们 想 要 的 代码 了 ,把 它 放 到 生产 线 上 实现 试 试 : 


# 修改 spiders/dmoz spider.py 文件 的 parse() 7; iX 
def parse(self, response): 
£ shell 帮 有 我 们 初始 化 好 sel, 这 里 我 们 要 自己 初始 化 
sel = scrapy.selector.Selector(response) 
sites = sel.xpath( //ul[(2class = "directory - url"]/li') 
for site in sites: 
title = site.xpath( 'a/text() '). extract() 
link = site.xpath( a/(Qhref').extract() 
desc = site.xpath( text() '). extract() 
print(title, link, desc) 


众望 所 归 ,如 图 14-31 所 示 。 
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本 | 零 基 础 入 | 


([u'Core Python Programming']. [u'http://www.pearsonhighered.com/educator/acade 
ic/product/90,,0130260363,0022Ben-USS 81DBC.htm1'], [yu'\r\n\t\r\n 
, VQ \r\n\t\t\t\r\n - By Wesley 
J. Chun; Prentice Hall PTR, 2001, ISBN 0130260363. For experienced deuelopers to 
improve extant skills: professional level examples. Starts by introducing synta 
x, objects, error handling, functions, classes, built-ins. [Prentice Hall]Mr^n 
APAn UNAMrAn 


([u'Data Structures and Algorithms with Object-Oriented Design Patterns in Pytho 
n'], [u'http://wwu.brpreiss.com/books/opus?/html/book.htm1'], [yu'\r\n\t\r\n 

s M \r\n\t\t\t\r\n 5 
The primary goal of this book is to promote object-oriented design using Pytho 
and to illustrate the use of the emerging object-oriented design patterns.VXr*n£ 


secondary goal of the book is to present mathematical tools just in time. Anal 
sis techniques and proofs are presented as needed and in the proper context.\r\ 
\ryn |, U' Nn 
"D 
([u'Diue Into Python 3'], [u'http://www.diueintopython.net/'], [uy'\r\n\t\r\n 
', U' \r\n\t\t\t\r\n 
- By Mark Pilgrim, Guide to Python 3 and its differences from Python 2. Each c 
apter starts with a real code sample and explains it fully. Has a comprehensive 
appendix of all the syntactic and semantic changes in Python 3XrXnXrXnXr An 


\ryn ', UM'MNrNn 
JD 
([u'Foundations of Python Network Programming'], [u'http://rhodesmill.org/brando 


n/2811/foundations-of-python-network-programming/'], [u'NrXnNtXrAn 
', uU. AANA tity tirn - This boo 


图 14-30 ”提取 数据 (四 ) 


2015-03-01 15:31: :28+0800 [dmoz] DEBUG: Crawled (200) <GET http: / /uww . dmoz .org/Co 
mputer mi on/ Resour 
gi ff-bot's Daily Python URL: 
\t\r\n ER 
ontains links to assorted resources from the Python uniue 
by PythonWare.Xr Vn rn 


—Ó———— | 
([u'Free Python and Zope Hosting Directoruy'], [u' http: // WWW. oinko.net/freepython 
/'], [yu'\r\n\t\r\n ，U \r\n\t\t\t\r\n 
- A directory of free Python and Zope hosting prouiders, w 
ith reviews and ratings.VXr^n Arn 
,UYU'\r\n 


]) 
([u"O'Reilly Python Center"], [u'http://oreilly.com/python/'], [uyu'\r\n\t\r\n 
". M \r\n\t\t\t\r\n 
- Features Python books, resources, news and articles.\r\n 
\F\n '", U'MrAn 
"D 


图 14-31 提取 数据 (五 ) 


14.8.10 41 Ħ item 


item 其 实 是 日 定义 的 一 个 容 太 , 用 法 跟 Python 的 字 邮 一样。 我 们 希望 Spiders TEE Jf 
诵 选 后 的 数据 存放 到 item Eas P PEEL spider 的 最 终 代 人 码 应 该 是 这 样 的 : 


import scrapy 
from tutorial. items import DmozItem 


class DmozSpider(scrapy. Spider): 
name - "dmoz" 
allowed domains - ["dmoz.org'] 
start urls = [ 
"http://www. dmoz. org/Computers/Programming/Languages/ Python/Books/" , 
"http://www. dmoz. org/Computers/Programming/Languages/Python/Resources/" 
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def parse(self, response): 

sel = scrapy. selector. Selector (response) 

sites = sel.xpath( '//ul[(à class = "directory - url"]/li') 

items [] 

for site in sites: 
item = DmozItenm() 
item[ title'] = site.xpath( 'a/text() '). extract() 
item['link'] = site.xpath( a/(Qhref'). extract() 
item[ 'desc'] site. xpath( 'text() '). extract() 
items. append( item) 

return items 


14.8.11 - 存储 内 容 


最 简单 存储 息 取 的 数据 的 方式 是 使 用 Feed exports, 主要 可 以 导出 四 种 格式 : JSON, 
JSON lines, CSV 和 XML 
这 里 将 结果 导出 为 最 常用 的 JSON 格式 : 


scrapy crawl dmoz - o items. json - t json 


-0 后 面 是 导出 的 文件 名 ,-t 指定 导出 类 型 。 
成 功 执行 命令 后 , 根 目 录 出 现 了 一 个 叫 items. json 的 文件 ,内 容 如 图 14-32 所 示 。 
至 此 ,我 们 成 功 地 使 用 Scrapy 框架 进行 了 一 次 完整 的 候 取 操作 。 


[f"desc": ["\rF\n\b\rN\n Ww 

We Wa NE NcNrAn - By Wesley J. Chun; 
Prentice Hall PTR, 2001, ISBN 0130260363. For experienced developers to 
improve extant skills; professional level examples. Starts by 
introducing syntax, objects, error handling, functions, classes, 
built-ins. [Prentice Hall]*Mr*Mn 

\r\n ma 

"NrAn "]J, "link": [" 
http://www.pearsonhighered.c educator/academic/prcocduct/0,,0130260363,00*$ 
2Ben-U»s2 OlDDC.html"], "title": ["Core Python Programming"]), 

"desc": ["\r\n\t\r\n ", 7 

\r\n\t\c\t\r\n - The primary qoal of this 
bock is to promote object-oriented design using Python and to illustrate 
the use of the emerging object-oriented design patterns.MXrMnA secondary 
goal of the book is to present mathematical tools just in time. Analysis 
techniques and proofs are presented as needed and in the proper 

context. VrAn 

\r\n g^ 

"NrAn "1, "link": [* 
http://www.brpreiss.com/books/opus7/html/book.htm1"], "title": ["Data 
Structures and Algorithms with Object-Oriented Design Patterns in 
Python"]1), 

("desc": ["™\r\n\t\r\n ", he 

\r\n\t\t\t\r\n - By Mark Pilgrim, Guide 
to Python 3 and its differences from Python 2. Each chapter starts with 
a real code sample and explains it fully. Has a comprehensive appendix 
of all che syntactic and semantic changes in Python 

3\r\n\r\n\r\n 

\r\n 

"NzAn "1, "link": [" 
http://www.diveintopython.net/"], "title": ["Dive Into Python 3"]], 
("desc": ["™\r\n\t\r\n ue 

NENDYENENENENPD — This book covers a wide 


图 14-32 存储 内 容 
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GUI 的 了 最终 选择 : Tkinter | 


到 目前 为 止 , 几 乎 所 有 的 Python 代码 都 是 处 于 一 个 文字 交互 界面 的 状态 。 当 然 , 有 些 尝 
ijj GEEK fij jj A np Sez Ud: "CHE ECCE , Python 本 来 就 应 该 简单 ,做 一 个 界面 多 费事 儿 
啊 1” 不 过 ,也 有 男 一 个 帮派 在 提 反 对 意见 :“ 我 的 用 户 群 体 可 全 都 是 电脑 小 白 , 他 们 可 能 会 更 
喜欢 友好 的 界面 ……?” 

Python 的 GUI 工具 包 有 很 多 ,之 前 学 习 过 的 EasyGui 就 是 其 中 最 简单 的 一 个 。 不 过 
EasyGui 实在 太 人 简单 了 ,因此 它 只 适合 做 大 家 接触 GUI 编程 的 敲门砖 。 下 面 要 讲 的 可 不 是 什 
么 二 流 的 货色 了 ,而 是 官方 御用 的 GUI 工具 包 一 一 Tkinter(IDLE 就 是 用 这 个 开发 的 ) 。 

Tkinter 是 Python 的 标准 GUI 库 , 它 实际 是 建立 在 Tk 技术 上 的 ,如 图 15-1 所 示 。Tk 最 
初 是 为 Tcl( 这 是 一 门 工 具 命 令 语言 ,不 是 那个 电视 机 品牌 ) 所 设计 的 ,但 由 于 其 可 移植 性 和 有 灵 
活性 高 ,加 上 非常 容易 使 用 ,因此 它 逐 渐 被 移植 到 许多 脚本 语言 中 ,包括 Perl, Ruby 和 


Python 。 
e 
EE 


图 15-1 Tkinter 


Tkinter 是 Python 默认 的 GUI 库 , 像 IDLE 就 是 用 Tkinter 设计 出 来 的 ,因此 直接 导入 
Tkinter 模块 就 可 以 了 : 


>>> import tkinter 


Ma 


45.1 Tkinter 之 初 体验 
— 


接 下 来 从 最 简单 的 例子 和 人手 : 


f p15_1. py 
import tkinter as tk 


root = tk.Tk() 

root.title("FishC Demo") 

theLabel = tk.Label(root, text = "我 的 第 二 个 窗口 程序 !") 
theLabel. pack( ) 


第 19 章 ”GUI 的 最 终 选择 ，Tkinter |P 


root. mainloop( ) 


执行 程序 ,如 图 15-2 所 示 。 et - n ERES 

代码 分 析 : 我 的 第 一 个 窗口 程序 ! 

# 创建 一 个 主 窗口 ,用 于 容纳 整个 GUI 程序 

root = tk.Tk() 图 15-2 我 的 第 二 个 窗口 程序 


H 设置 主 窗口 对 象 的 标题 栏 

root. title("FishC Demo") 

# 添加 一 个 Label 组 件 ,Label 组 件 是 GUI 程序 中 最 常用 的 组 件 之 一 。 
# Label 组 件 可 以 显示 文本 、 图 标 或 者 图 片 

# 在 这 里 我 们 让 它 显示 指定 文本 

theLabel = tk.Label(root, text = "我 的 第 二 个 窗口 程序 !") 

# 然后 调用 Label 组 件 的 pack() 方 法 ,用 于 自动 调节 组 件 自 身 的 尺寸 
theLabel. pack( ) 

# 注意 ,这 时 候 窗口 还 是 不 会 显示 的 … 

# 除非 执行 下 面 这 条 代码 ! 


root. mainloop() 

tkinter. mainloopO 〇 通常 是 你 程序 的 最 后 一 行 代码 ,执行 后 程序 进入 主事 件 循环 。 学 习 过 
5 Tn 2s Fe 1 HJ Jr iU UT E— ^] 4; Don't call me. I will call you. ". 意思 是 一 旦 进入 了 主 
事件 循环 ,就 由 Tkinter 掌管 一 切 了 。 现 在 不 理解 没关系 ,在 后 面 的 学 习 中 你 会 有 深刻 的 体 
4. GUI 程序 的 开发 与 以 往 的 开发 经 验 会 有 截然 不 同 的 感受 。 


进 阶 版 本 


通 篆 如 条 要 写 一 个 比较 大 的 程序 ,那么 应 该 先 把 代码 给 封装 起 来 。 在 面 问 对 象 的 编程 语 
言 中 ,就 是 封装 成 类 。 看 下 面 进 阶 版 的 例子 : 


# pl15-2.py 
import tkinter as tk 


class App: 
def init (self, root): 
frame - tk.Frame(root) 
frame. pack( ) 
self.hi there = tk.Button(frame, text = "打招呼 ", fg = command = self. say hi) 
self.hi there. pack(side = tk. LEFT) 


def say hi(self): 
print(" 互 联网 的 广大 朋友 们 大 家 好 ,我 是 小 甲鱼 !") 


root = tk.Tk() 


>>> 
app = App(root) 


互联 网 的 广大 朋友 们 大 家 好 ， 我 是 小 甲鱼 | 


root. mainloop() f t- oø x 

程序 跑 起 来 后 出 现 一 个 “打招呼 ”按钮 , 单 打招呼 
击 它 就 能 从 IDLE 接收 到 回馈 信息 ,如 图 15-3 
所 示 。 图 15-3 ” 进 阶 版 本 (一 ) 
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代码 分 析 : 


import tkinter as tk 


class App: 
def init (self, root): 
# 创建 一 个 框架 ,然后 在 里 边 添加 一 个 Button 按钮 组 件 
# 框架 一 般 是 用 于 在 复杂 的 布局 中 起 到 将 组 件 分 组 的 作用 
frame = tk.Frame(root) 
frame. pack( ) 


# 创建 一 个 按钮 组 件 ,fg 是 foreground 的 缩写 ,就 是 设置 前 景色 的 意思 
self.hi there = tk.Button(frame, text = "打招呼 ", fg= "blue", command = self. say hi) 
self. hi there. pack() 


def say hi(self): 
print(" 互 联网 的 广大 朋友 们 大 家 好 ,我 是 小 甲鱼 !") 


# 创建 一 个 toplevel 的 根 窗 口 ,并 把 它 作 为 参数 实例 化 app 对 象 
root = tk.Tk() 


app = App(root) 
# 开始 主事 件 循环 


root. mainloop() 


可 以 通过 修改 pack O Jr HW side 参数 ,side 参数 可 以 设置 LEFT、RIGHT、TOP 和 
TOTTOM 四 个 方位 ,默认 的 设置 是 side= tkinter. TOP, 

例如 可 以 修改 为 左 对 齐 frame. pack(side— tk. LEFT) ,修改 后 程序 如 图 15-4 所 示 。 

如 果 你 不 想 按 钮 挨 着 “墙角 ”, 可 以 通过 设置 pack() 方 法 的 padx 和 pady 参数 自 定 义 按钮 
的 偶 移 位 置 : 

frame. pack(side = tk. LEFT, padx = 10, pady = 10) 

修改 后 程序 如 图 15-5 所 示 。 

按钮 既然 可 以 设置 前 景色 , 那 一 定 也 能 设置 背景 色 吧 ? 没 错 ,bg 参数 就 是 background 1$ 
景色 的 缩写 : 


self.hi there = tk. Button(frame, text = "打招呼 ", bg= "black", fg= "white", command = self.say hi) 
修改 后 程序 如 图 15-6 所 示 。 
4t- nS ft - o E 
ft - o E 


| EL] 


图 15-4 进 阶 版 本 (二 ) 图 15-5” 进 阶 版 本 (三 ) 图 15-6 进 阶 版 本 (四 ) 


15.2 Label 组 件 


人 限制 内 容 , 请 满 18 岁 后 再 点 击 观 看 1”, 如 图 15-7 所 示 。 
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f tk - : ES 


您 所 下 载 的 影片 含有 未成 年 人 限制 内 容 ， 请 满 18 岁 后 再 点 击 观看 ! T) 


15-7 Label £H fF  —) 


* p15_3. py 
from tkinter import * 


# 导入 tkinter 模块 的 所 有 内 容 


root = Tk() 

# 创建 一 个 文本 Label 对 象 

textLabel = Label(root, V 

text = "您 所 下 载 的 影片 含有 未 成 年 人 限制 内 容 , 请 满 18 岁 后 再 点 击 观 看 !") 
textLabel.pack(side = LEFT) 

# 创建 一 个 图 像 Label 对 象 

# 用 PhotoImage 实例 化 一 个 图 片 对 象 (支持 gif 格式 的 图 片 ) 

photo = PhotoImage(file= "18.gif") 

imgLabel = Label(root, image = photo) 

imgLabel. pack( side = RIGHT) 


mainloop() 

可 以 直接 在 字符 串 中 使 用 \n 对 现实 中 的 文本 进行 断 行 ,如 图 15-8 所 示 。 

如 果 想 将 文字 部 分 左 对 齐 , 并 在 水 平 位 置 与 边框 留 有 一 定 的 距离 ,只 需要 设置 Label 的 
justify 和 padx 选项 即 可 : 

textLabel = Label(root, 


text = "您 所 下 载 的 影片 含有 未 成 年 人 限制 内 容 ,\n 请 满 18 岁 后 再 点 击 观看 ! "， 
justify = LEFT, padx = 10) 


程序 实现 如 图 15-9 所 示 。 


í tk -= í ik - om 
您 所 下 载 的 影片 含有 未 成 年 人 限制 内 容 ， 您 所 下 载 的 影片 含有 未 成 年 人 限制 内 容 ， 

请 涝 18 淮 后 再 点 击 观看 ! 请 满 18 内 后 再 点 击 观看 ! 

图 15-8 Label 组 件 ( 二 ) 图 15-9 Label 组 件 ( 三 ) 


有 时 候 可 能 需要 将 图 片 和 文字 分 开 , 例 如 将 图 片 作为 背景, 文字 显示 在 图 片 的 上 面 , 只 需 
要 设置 compound 选项 即 可 : 


# pl5 4.py 
from tkinter import * 


root - Tk() 
photo = PhotolImage(file = "bg. gif") 
theLabel = Label(root, 
text = "学 Python\n 到 FishC", 
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justify - LEFT, 
image = photo, 
compound = CENTER, £ 设置 文本 和 图 像 的 混合 模式 
font = (" 华 康 少女 字体 "，20)，# 设置 字体 和 字号 
fg= "white" £ 设置 文本 颜色 
) 

theLabel. pack( ) 


mainloop() 
程序 实现 如 图 15-10 所 示 。 


e» Dython- 


Al FishC wa 


15-10 Label £H f/F C JU) 


(15.3 Button 组 件 


Button 组 件 是 用 于 实现 一 个 按钮 , 它 的 绝 大 多 数 选项 跟 Label 组 件 是 一 样 的 。 不 过 
Button 组 有 一 个 Label 组 件 实现 不 了 的 功能 , 那 就 是 可 以 接收 用 户 的 信息 。Button 组 件 有 一 
个 command 选项 ,用 于 指定 一 个 函数 或 方法 , 当 用 户 单 击 按钮 的 时 候 ,Tkinter 就 会 自动 地 去 
调用 这 个 函数 或 方法 了 。 

下 面 修改 第 一 个 例子 ,添加 一 个 按钮 ,在 按钮 被 单 击 之 后 Label 文本 发 生 改 变 。 想 要 文本 
发 生 改 变 , 只 需要 设置 textvariable 选项 为 Tkinter 变量 即 可 : 


# p15 5.py 
from tkinter import * 


def callback(): 
var. set(" 吹 吧 你 ,我 才 不 信 呢 一 ") 


root = Tk() 
framel = Frame(root) 
frame2 - Frame(root) 


# 创建 一 个 文本 Label 对 象 
var = StringVar() 
var. set(" 您 所 下 载 的 影片 含有 未 成 年 人 限制 内 容 ,\n 请 满 18 岁 后 再 点 击 观看 !") 
textLabel = Label(framel, 
textvariable - var, 
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justify = LEFT) 
textLabel. pack( side = LEFT) 
# 创建 一 个 图 像 Label 对 象 
# 用 PhotoImage 实例 化 一 个 图 片 对 象 (支持 gif 格式 的 图 片 ) 
photo = PhotoImage(file = "18.gif") 
imgLabel = Label(framel, image = photo) 
imgLabel. pack( side = RIGHT) 
# 加 一 个 按钮 
theButton = Button(frame2, text = "已 满 18 周岁 ", command = callback) 
theButton. pack( ) 
framel.pack(padx = 10, pady = 10) 
frame2.pack(padx = 10, pady = 10) 


mainloop() 


45.4 Checkbutton 组 件 


w 


Checkbutton 组 件 就 是 常见 的 多 选 按钮 ,而 Radiobutton 则 是 单 选 按钮 。 


* p15_6. py 
from tkinter import * 


root = Tk() 

# 需要 一 个 Tkinter 变量 , 用 于 表示 该 按钮 是 否 被 选中 

v = IntVar() 

c = Checkbutton(root, text = "测试 一 下 "，variable = v) 
c. pack( ) 

# 如 果 选 项 被 选中 ,那么 变量 v 被 赋值 为 1, 否则 为 0 

# 可 以 用 个 Label 标签 动态 地 给 大 家 展示 : 

l = Label(root, textvariable = v) 

l. pack() 


mainloop() 


程序 实现 如 图 15-11 所 示 。 
当 单 击 选项 时 ,Label 显示 的 变量 相应 地 发 生 了 改变 ,如 图 15-12 所 示 。 
有 了 前 面 的 基础 ,下 面 写 一 个 古代 四 大 美女 的 程序 : 


from tkinter import * 


root - Tk() 

GIRLS = ["Püj;", "ERA", "貂蝉 "," 杨 玉环 "] 

vx [] 

for girl in GIRLS: 
v. append( IntVar( ) ) 
b = Checkbutton(root, text = girl, variable - v[ - 1]) 
b. pack( ) 


mainloop() 


程序 实现 如 图 15-13 所 示 。 
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EEE- 
[- 西施 
tt- nl gt- nl 厂 ERE 
厂 测试 一 下 v 测试 一 下 [ £s 
0 1 BE 杨 玉 环 


图 15-11 Checkbutton 组 件 ( 一 ) 图 15-12 Checkbutton 组 件 ( 二 ) 图 15-13 古代 四 大 美女 的 程序 


这 里 应 该 把 所 有 的 Checkbutton 组 件 都 问 左 对 齐 一 下 会 比较 好 看 ,通过 设置 pack() 方 法 
的 anchor 选项 可 以 实现 。anchor 选项 是 用 于 指定 显示 位 置 , 可 以 设置 为 N\NE、 上 E、SE、S、 
SW、W、NW fil CENTER 九 个 不 同 的 值 。 相 信和 地 理学 得 不 错 的 朋友 一 下 子 就 反应 过 来 了 , 它 
们 正 是 东西 南北 的 缩写 ,然后 按照 地 图 上 的 “上 北 下 南 左 西 右 东 ”的 原则 ,这 样 就 可 以 定位 要 显 
示 的 位 置 了 ,如 图 15-14 所 示 。 

这 里 要 “ 左 对 齐 ”, 也 就 是 设置 b. packCanchor- W) ,修改 后 如 图 15-15 所 示 。 


ft- o ES 
[ 西施 
[ ims 
[- £o 
厂 杨 玉 环 


图 15-14 anchor 选项 图 15-15 ”修改 后 的 程序 


(15.5 Radiobutton 组 件 


th 


Radiobutton 组 件 跟 Checkbutton 组 件 的 用 法 基本 一 致 ,唯一 不 同 的 是 Radiobutton 实现 
的 是 “ 单 选 ?的 效果 。 要 实现 这 种 互 斥 的 效果 ,同一 组 内 的 所 有 Radiobutton 只 能 共享 一 个 
variable 选项 ,并 且 需 要 设置 不 同 的 value 选项 值 : 


# p15 8.py 
from tkinter import * 


root - Tk() 
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v = IntVar() 

Radiobutton(root, text = "One", variable = v, value = 1).pack(anchor = W) 
Radiobutton(root, text = "Two", variable = v, value = 2).pack(anchor = W) 
Radiobutton(root, text = "Three", variable = v, value = 3). pack(anchor = W) 


mainloop() 


程序 实现 如 图 15-16 所 示 。 
如 果 有 多 个 选项 ,可 以 使 用 循环 来 处 理 , 这 会 使 得 代码 更 加 简洁 : 


# pl5 9.py 
from tkinter import * 


root - Tk() 

LANGS = [ 
("Python", 1), 
("Perl", 2), 


("Ruby", 3), 

("Lua", 4)] 
v - IntVar() 
v.set(1) 


for lang, num in LANGS: 
b = Radiobutton(root, text = lang, variable = v, value = num) 
b. pack(anchor = W) 


mainloop() 

程序 实现 如 图 15-17 所 示 。 

在 此 ,如 果 你 不 喜欢 前 面 这 个 小 圈 圈 ,还 可 以 改 成 按钮 的 形式 : 
# 将 indicatoron 设置 为 False 即 可 去 掉 前 面 的 小 圆圈 


b = Radiobutton(root, text = lang, variable- v, value = num, indicatoron = False) 
b. pack(fill = X) 


程序 修改 后 如 图 15-18 所 示 。 


¢t- DL tt- o ESI 
At - n ES (* Python Python 
C One C Perl Perl 
oh C Raby Ruby 
C Three C Lua Lua 


图 15-16  Radiobutton £H ff (—) 15-17  Radiobutton 组 件 ( 二 ) KI 15-18  Radiobutton £8 f/F € —) 


15. 6 LabelFrame 组 件 


—5 


LabelFrame 组 件 是 Frame 框架 的 进化 版 ,从 形态 上 来 说 ,也 就 是 添加 了 Label 的 Frame. 
但 有 了 它 ,Checkbutton 和 Radiobutton 的 组 件 分 组 就 变 得 简单 了 ; 
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# pl5 10.py 
from tkinter import * 


root - Tk() 
group = LabelFrame(root, text = "最 好 的 脚本 语言 是 ?"，padx=5，pady= 5) 
group. pack(padx = 10, pady = 10) 
LANGS = [ 
("Python", 1), 
("Perl", 2), 


("Ruby", 3), 

("Lua", 4)] 
v - IntVar() 
v.set(1) 


for lang, num in LANGS: 
b = Radiobutton(group, text = lang, variable = v, value = num) 
b. pack(anchor = W) 


mainloop() 


程序 实现 如 图 15-19 所 示 。 


2 


15.7 Entry 组 件 
s" 


` 


Entry 组 件 就 是 平时 所 说 的 输入 框 。 输 入 框 是 跟 程序 打交道 的 一 个 途径 ,例如 程序 要 求 
你 输入 账号 密码 ,那么 它 就 需要 提供 两 个 输入 框 给 你 ,用 于 接收 密码 的 输入 框 还 会 用 星 号 将 实 
际 输入 的 内 容 隐 藏 起 来 。 

学 了 前 面 好 几 个 Tkinter 的 组 件 之 后 应 该 不 难 发 现 一 一 其 实 很 多 方法 和 选项 它们 之 间 都 
是 通用 的 。 例 如 在 输入 框 中 用 代码 添加 和 删除 内 容 , 同 样 也 是 使 用 insert ORI delete() 方 法 : 


# pl5 11. py 
from tkinter import * 


root - Tk() 

e = Entry(root) 

e. pack(padx = 20, pady = 20) 
e.delete(0, END) 

e. insert(0，" 默 认 文 本 …") 


mainloop() 


程序 实现 如 图 15-20 所 示 。 
获取 输入 框 里 边 的 内 容 , 可 以 使 用 Entry 组 件 的 get() 方 法 。 当 然 也 可 以 将 一 个 Tkinter 
的 变量 (通常 是 StringVar $E £4 $l| textvariable 选项 ,然后 通过 变量 的 get() 方 法 获取 。 


"me xs 在 下 面 的 例子 中 ,添加 一 个 按钮 , 当 单 击 按钮 的 时 候 , 获 
k 取 输 入 框 的 内 容 并 打印 出 来 ,然后 清空 输入 框 。 
默认 文本 .… 程序 实现 起 来 如 图 15-21 所 示 。 


单 击 “ 获 取信 息 ” 按 钮 ,在 IDLE 中 将 输入 框 中 的 内 容 显 示 
15-20 Entry 组 件 (一 ) 出 来 ,如 图 15-22 Bs, 
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:《( 零 基础 入 门 学 习 Python)》 
:小 甲鱼 
f k è - OES k -EF 
作品 : 零 基 础 入 门 学 习 Python 作品 : 零 基础 入 门 学 习 Python 


小 甲鱼 


作者 : 小 甲鱼 作者 
amsa | ms | sme | EN 


图 15-21 Entry 组 件 ( 二 ) 图 15-22 Entry 输入 框 


# pl5 12. py 
from tkinter import * 


root - Tk() 

# Tkinter 总 共 提 供 了 三 种 布局 组 件 的 方法 : pack(), gird() fll place() 
# grid() 方 法 允许 你 用 表格 的 形式 来 管理 组 件 的 位 置 

£ row 选项 代表 行 ,column 选项 代表 列 

£ 例如 row- 1,column- 2 表示 第 二 行 第 三 列 (0 表示 第 一 行 ) 
Label(root, text = "作品 : ").grid(row- 0) 
Label(root，text = "作者 : ").grid(row- 1) 

el = Entry(root) 

e2 = Entry(root) 

el.grid(row- 0, column = 1, padx = 10, pady = 5) 
e2.grid(row- 1, column = 1, padx = 10, pady = 5) 


def show( ) : 
print(" 作 品 : «% s»" % el.get()) 
print(" 作 者 : &s" % e2.get()) 
el.delete(0, END) 
e2.delete(0, END) 


# 如 果 表 格 大 于 组 件 , 那么 可 以 使 用 sticky 选项 来 设置 组 件 的 位 置 

# 同样 你 需要 使 用 N,E,S,W 以 及 它们 的 组 合 NE, SE, SW, NW 来 表示 方位 

Button(root, text = "获取 信息 "，width = 10, command = show)\ 
.grid(row- 3, column = 0, sticky = W, padx = 10, pady= 5) 

Button(root, text = "iR iH", width= 10, command = root. quit) \ 
.grid(row- 3, column = 1, sticky - E, padx = 10, pady = 5) 


mainloop() 

你 可 能 会 遇 到 问题 : 为 什么 单 击 “退出 ?按钮 没有 反应 ? 这 是 因为 之 前 也 提 到 过 ,Python 
的 IDLE 事实 上 也 是 使 用 Tkinter 设计 的 ,因此 当 程 序 是 使 用 IDLE 运行 的 时 候 , 就 会 出 现 此 
类 冲突 。 解 决 的 方法 也 很 简单 ,只 需要 直接 双击 打开 程序 即 可 。 

如 果 想 设计 一 个 密码 输入 框 , 即 使 用 星 号 (* ) 代 蔡 用 户 输入 的 内 容 , 只 需要 设置 show 选 
项 即 可 : 


# pl5 13.py 
from tkinter import * 


root - Tk() 
Label(root, text = "账号 : ").grid(row- 0) 
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Label(root, text = "密码 : ").grid(row- 1) 
vl = StringVar() 
v2 = StringVar() 

= Entry(root, textvariable = v1) 

= Entry(root, textvariable - v2, show- " x ") 
el.grid(row- 0, column = 1, padx = 10, pady = 5) 
e2.grid(row- 1, column = 1, padx = 10, pady = 5) 


def show( ) : 
print(" 账 号 : &s" % vl.get()) 
print(" 密 码 : &s" % v2.get()) 
el. delete(0，END) 
e2. delete(0，END) 


Button(root, text = "芝麻 开门 "，width = 10, command = show) V 
.grid(row- 3, column = 0, sticky = W, padx = 10, pady= 5) 
Button(root, text = "退出 ", width- 10, command = root. quit) \ 
. grid(row = 3, column = 1, sticky - E, padx = 10, pady = 5) 


mainloop() 


程序 实现 如 图 15-23 所 示 。 
单 击 “芝麻 开门 ?可 以 得 到 密码 的 信息 ,如 图 15-24 所 示 。 


15-23 Entry £H fF CA) 图 15-24 Entry 组 件 ( 四 ) 


男 外 ,Entry 组 件 还 支持 验证 输入 内 容 的 合法 性 。 例 如 输入 框 要 求 输入 的 是 数字 ,用 户 输 
入 了 字母 那 就 属于 “非法 ”。 实 现 该 功能 ,需要 通过 设置 validate, validatecommand 和 
invalidcommand 三 个 选项 。 


首先 启用 验证 的 “开关 ”是 validate 选项 ,该 选项 可 以 设置 的 值 如 表 15-1 所 示 。 
表 15-1 validate 选项 可 以 设置 的 值 


fü * 义 
'focus ' 当 Entry 组 件 获 得 或 失去 焦点 的 时 候 验 证 
'focusin' 34 Entry 组 件 获 得 焦点 的 时 候 验 证 
'focusout' 当 Entry 组 件 失 去 焦点 的 时 候 验证 
'key' 当 输 入 框 被 编辑 的 时 候 验 证 
'all' 当 出 现 上 面 任何 一 种 情况 的 时 候 验证 
'none' 关闭 验证 功能 。 默 认 设 置 该 选项 ( 即 不 启用 验证 )。 注 意 , 是 字符 串 的 'none', 而 非 None 


其 次 是 为 validatecommand 3€Jit 8 4E — A Js E PR AC. 1 PR RUR B x E] True 或 False 表示 
Js uH. I sn Pw ub BR AA EL eR AB h AREE TJ PI BI nf . uf LL E Entry 组 件 的 get() 
方法 获得 该 字符 串 。 
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在 下 面 的 例子 中 ,在 第 一 个 输入 框 中 输入 “小 甲鱼 ”并 通过 Tab 键 将 焦点 转移 到 第 二 个 输 
入 框 的 时 候 , 验 证 功能 被 成 功 触 发 : 


# pl5 14. py 
from tkinter import * 


root = Tk() 


def test(): 

if el.get() == "小 甲鱼 ": 
print(" 正 确 !") 
return True 

else: 
print(" f ix!") 
el.delete(0, END) 
return False 


v = StringVar() 

el = Entry(root, textvariable- v, validate = "focusout", validatecommand = test) 
e2 - Entry(root) 

el.pack(padx = 10, pady = 10) 

e2. pack(padx = 10, pady = 10) 


mainloop() 


程序 实现 如 图 15-25 所 示 。 
最 后 ,invalidcommand i Jit J& 4E I] pg 7A E178 E validatecommand 的 返回 值 为 False 的 时 


候 才 被 调用 。 
在 下 面 的 例子 中 ,在 第 一 个 输入 框 中 输入 "小钱 鱼 ”, 并 通过 Tab 键 将 焦点 转移 到 第 二 个 
输入 框 ,validatecommand 指定 的 验证 男 数 被 触发 并 返回 False. {%7 invalidcommand 被 触发 : 
# pl5 15.py 


def test2(): 
print(" j£ 8 Wi Hl Y ...... ") 


return True 


el = Entry (master, textvariable = v, validate = " focusout", validatecommand = testl, 
invalidcommand - test2) 


程序 修改 后 实现 如 图 15-26 所 示 。 


图 15-25 ” Entry 组 件 ( 五 ) 图 15-26 Entry 组 件 ( 六 ) 


其 实 ,Tkinter 还 有 个 “隐藏 技能 ” Tkinter 为 验证 辆 数 提供 一 些 额外 的 选项 ,如 表 15-2 


所 示 。 
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表 15-2 Tkinter 为 验证 函数 提供 一 些 额 外 的 选项 


选项 含 x 
'%d"' | 操作 代码 : 0 表示 删除 操作 ; 1 表示 插入 操作 ; 2 表示 获得 失去 焦点 或 textvariable 变量 的 值 被 修改 
当 用 户 尝 试 插入 或 删除 操作 的 时 候 , 该 选项 表示 插入 或 删除 的 位 置 (索引 号 ) 


和 ”| 如 果 是 由 于 获得 、 失 去 焦点 或 textvariable 变量 的 值 被 修改 而 调用 验证 函数 ,那么 该 值 是 一 1 
,yp，| 当 输 入 框 的 值 多 许 改变 的 时 候 , 该 值 有 效 
0 


该 值 为 输入 框 的 最 新 文本 内 容 
'%s' | 该 值 为 调用 验证 函数 前 输入 框 的 文本 内 容 
当 插 入 或 删除 操作 触发 验证 函数 的 时 候 , 该 值 有 效 


该 选项 表示 文本 被 插入 和 删除 的 内 容 
'%v' | 该 组 件 当 前 的 validate 选项 的 值 
— 调用 验证 函数 的 原因 


该 值 是 'focusin', 'focusout', 'key' 或 'forced'(textvariable 选项 指定 的 变量 值 被 修改 ) 中 的 一 个 
'%W' | 该 组 件 的 名 字 


为 了 使 用 这 些 选 项 ,你 可 以 这 样 写 : 
Validatecommand = (f, s1, s2, ...) 


其 中 ,f deus uEPRAUM.sl.s2.s3 是 额外 的 选项 ,这 些 选项 会 作为 参数 依次 传 给 函数。 在 
此 之 前 ,需要 调用 register() 方 法 将 验证 困 数 包装 起 来 ; 


# pl5 16. py 
from tkinter import * 


root - Tk() 
v = StringVar() 


def test(content, reason, name): 

if content == "小 甲鱼 ": 
print(" IE 8f! ") 
print(content, reason, name) 
return True 

else: 
print(" f ix!") 
print(content, reason, name) 
return False 


testCMD = root.register(test) 

el = Entry(root, textvariable = v, validate = "focusout", validatecommand = (testCMD, '%P', '&v', '%W')) 
e2 - Entry(root) 

el.pack(padx = 10, pady = 10) 

e2. pack(padx = 10, pady = 10) 


mainloop() 


程序 实现 如 图 15-27 所 示 。 
下 面 实现 一 个 简单 的 计算 需 : 


# pl5 17.py 
from tkinter import * 
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root = Tk() 
frame = Frame(root) 
frame. pack(padx = 10, pady = 10) 


vl = StringVar() 
v2 = StringVar() 
v3 - StringVar() 


def test(content): 
# 注意 ,这 里 你 不 能 使 用 el. get() 或 者 v1.get() 来 获取 输入 的 内 容 
* 因为 validate 选项 指定 为 "key" 的 时 候 , 有 任何 输入 操作 都 会 被 拦截 到 这 个 函数 中 
# 也 就 是 说 先 拦截 ,只 有 这 个 函数 返回 True, 那么 输入 的 内 容 才 会 到 变量 里 边 
H 所 以 要 使 用 %P 来 获取 最 新 的 输入 框 内 容 
if content. isdigit(): 
return True 
else: 
return False 


testCMD = root.register(test) 

Entry(frame, textvariable- v1, width= 10, validate = "key", V 
validatecommand = (testCMD, '% P')).grid(row- 0, column = 0) 

Label(frame, text = "+ ").grid(row- 0, column- 1) 

Entry(frame, textvariable- v2, width= 10, validate = "key", V 
validatecommand = (testCMD, '€&P')).grid(row- 0, column = 2) 

Label(frame, text = "- ").grid(row- 0, column = 3) 

Entry(frame, textvariable- v3, width= 10, validate = "key", V 
validatecommand = (testCMD, '*&P')).grid(row - 0, column - 4) 


def calc(): 
result = int(vl.get()) + int(v2.get()) 
v3. set( result) 
Button(frame, text = "计算 结果 "，command = calc).grid(row= 1, column= 2, pady= 5) 


mainloop() 


程序 实现 如 图 15-28 HIZR , 


^F yUlOr 3.4.1 
(ox -- EA- 
ptions Windows Help 
小 甲鱼 lle01efc, May 18 201 
s" or "license()" fo 
ce dem 
=========== RESTART ri tk E 
错误 ! 112345 +|54321 = |66666 
小 甲鱼 我 爱 你 focusout .50592688 : 
正确 ! 计算 结果 | 


/|NFRÉB focusout .58592688 
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45.8 Listbox 组 件 
—/ 


如 果 需 要 提供 选项 给 用 户 选 择 , 单 选 可 以 用 Radiobutton 组 件 , 多 选 则 可 以 用 
Checkbutton 组 件 。 但 如 果 提 供 的 选项 非常 多 ,例如 选择 你 所 在 的 城市 ,通过 Radiobutton 和 
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Checkbutton 组 件 来 实现 直接 导致 的 结果 就 是 : 用 户 界 面 不 够 存放 那么 多 按钮 ! 

这 时 候 就 可 以 考虑 使 用 Listbox 组 件 ,Listbox 是 以 列表 的 形式 显示 出 来 ,并 支持 滚动 条 
操作 ,所 以 对 于 在 需要 提供 大 量 选项 的 情况 下 会 更 适用 一 些 。 

当 创 建 一 个 Listbox 组 件 的 时 候 , 它 是 空 的 (里 边 什 么 都 没有 )。 所 以 ,首先 要 做 的 第 一 件 
事 就 是 添加 一 行 或 多 行文 本 进去 。 使 用 insert() 方 法 添加 文本 ,该 方法 有 两 个 参数 : 第 一 个 参数 
是 插入 的 索引 号 ,第 二 个 参数 是 插入 的 字符 串 。 索 引号 通常 是 项 目的 序号 (第 一 项 的 序号 是 0)。 

当然 对 于 多 个 项 目 ,应 该 使 用 循环 : 


# p15-18. py 
from tkinter import * 


root - Tk() 
# 创建 一 个 空 列 表 
theLB = Listbox(root, setgrid= True) 
theLB. pack( ) 
£ 往 列表 里 添加 数据 
for item in [" 鸡 蛋 "，" 鸭 和 蛋 "，" 鹅 蛋 "，" 李 狗 蛋 "] : 
theLB. insert(END, item) 
theButton = Button(root, text = "删除 ", command = lambda x = theLB: x.delete(ACTIVE)) 
theButton. pack( ) 


mainloop() 
EM 15-29 所 示 。 /'«- x 
elete() 方 法 删除 列表 中 的 项 目 , 最 常用 的 操作 是 删除 — 
列表 中 的 所 有 项 目 : listbox. delete(0, END) 
当然 也 可 以 删除 指定 的 项 目 , 下 边 涂 加 一 个 独立 按钮 来 删除 388 
ACTIVE 状态 的 项 目 : ps 


# PREND 一 样 ,这 个 ACTIVE 是 一 个 特殊 的 索引 号 ,表示 当前 被 选中 的 项 目 ) 
theButton = Button(master, text = "删除 "，command = lambda x = 
theLB: x.delete(ACTIVE)) 

theButton. pack( ) 


最 后 ,这 个 Listbox 组 件 根据 selectmode 选项 提供 了 了 四 种 不 , 
图 15-29 Listbox 2B fF C —) 
同 的 选择 模式 : SINGLE CÉ), BROWSE Gh, JE Hf 3X , 4H d zJ] BR 
标 或 通过 方向 键 可 以 直接 改变 选项 ) | MUL TIPLE CAE 3k) fll EXTENDED( 也 是 多 选 ,但 需要 
同时 按 住 Shift 键 或 Ctrl 键 或 拖 动 光标 实现 )。 默 认 的 选择 模式 是 BROWSE。 
选项 增多 麻烦 事 儿 就 接 是 而 来 ,例如 你 发 现 Listbox 组 件 默 认 只 能 显示 10 个 项 目 , 而 你 
手头 有 11 个 项 目 : 


# p15_19. py 
from tkinter import * 


root - Tk() 
# 创建 一 个 空 列表 
theLB = Listbox(root, setgrid- True) 
theLB. pack( ) 
# 往 列 表 里 添 加 数据 
for item in range(11): 
theLB. insert(END, item) 
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mainloop() 
程序 实现 如 图 15-30 所 示 。 
虽然 说 利用 鼠标 滚轮 可 以 迫使 最 后 一 个 项 目 “ 现 身 ”, 但 这 样 往往 很 容易 被 用 户 忽略 …… 


有 两 个 方法 可 以 解决 上 述 问题 ,第 一 方法 就 是 修改 height 选项 : 
theLB = Listbox(master, height = 11) 


修改 后 程序 如 图 15-31 所 示 。 
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图 15-30  Listbox £H fF C) 图 15-31 Listbox 组 件 ( 三 ) 


修改 height 选项 固然 可 以 达到 我 们 的 目的 ,但 如 果 项 目 太 多 (例如 一 百 多 个 ) ,这 个 方法 
就 不 适用 了 了 (导致 列表 框 太 长 )。 还 有 一 个 方法 更 灵活 ,就 是 为 Listbox 组件 添 加 滚动 条 。 


15.9 Scrollbar ZB fF 
as" 


虽然 滚动 条 是 作为 一 个 独立 的 组 件 存在 ,不 过 平时 它 都 是 几乎 与 其 他 组 件 配合 使 用 的 。 
下 面 例子 演示 如 何 使 用 垂直 滚动 条 。 

为 了 在 某 个 组 件 上 安装 垂直 深 动 条 ,需要 做 两 件 事 : 

(1) 设置 该 组 件 的 yscrollbarcommand 选项 为 Scrollbar 组 件 的 setO 77 3X: ; 

(2) 设置 Scrollbar 组 件 的 command 选项 为 该 组 件 的 yview() 方 法 。 


# pl5 20.py 
from tkinter import * 

1 « -OES 
root = Tk() 555 al 
sb = Scrollbar(root) 556 
Sb. pack( side = RIGHT, fill- Y) 557 
lb = Listbox(root, yscrollcommand = sb. set) 558 
for i in range(1000): 559 

lb.insert(END, str(i)) 560 Ld 
lb. pack( side = LEFT, fill = BOTH) 561 
sb. conf ig(command = lb. yview) 562 
563 
mainloop() 564 ~| 
程序 实现 如 图 15-32 Bran 图 15-32 Scrollbar 组 件 
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分 析 : 事实 上 这 是 一 个 互联 互通 的 过 程 。 当 用 户 操作 滚动 条 进行 滚动 的 时 候 , 滚 动 条 啊 应 
滚动 并 同时 通过 Listbox 组 件 的 yview() 方 法 滚动 列表 框 里 的 内 容 ; 同样 , 当 列 表 框 中 可 视 范 围 
发 生 改变 的 时 候 ,Listbox 组件 通过 调用 Scrollbar 组 件 的 set() 方 法 设置 滚动 条 的 最 新 位 置 。 


115.10 Scale 组 件 
as" 


Scale 组 件 跟 Scrollbar 滚动 条 组 件 很 相似 一 一 都 可 以 滚 .都 有 滑 块 、 都 是 条 形 …… 但 它们 
的 使 用 范围 可 不 尽 相 同 。Scale 组 件 主要 是 通过 滑 块 来 表示 某 个 范围 内 的 一 个 数字 ,可 以 通过 
修改 选项 设置 范围 以 及 分 辨 率 (精度 )， 

当 希 望 用 户 输入 某 个 范围 内 的 一 个 数值 ,使 用 Scale 组 件 可 以 很 好 地 代 蔡 Entry 组 件 。 
创建 一 个 指定 范围 的 Scale 组 件 其 实 非常 容易 ,只 需要 指定 它 的 from 和 to 两 个 选项 即 可 。 但 
由 于 from 本 身 是 Python 的 关键 字 , 所 以 为 了 区 分 需要 在 后 边 紧 跟 一 个 下 划 线 ,如 from , 


# pl5 21.py 
from tkinter import * 


root = Tk() 
Scale(root, from =0, to= 42).pack() 
Scale(root, from =0, to- 200, orient = HORIZONTAL). pack( ) 


mainloop() 


程序 实现 如 图 15-33 所 示 。 TEN 
使 用 get() 方 法 可 以 获取 当前 滑 块 的 位 置 

# p15_22. py 

from tkinter import * 18 

root = Tk() 

sl = Scale(root, from_= 0, to= 42) 110 
S1.pack() 

s2 = Scale(root, from - 0, to- 200, orient = HORIZONTAL) 

s2. pack() 15-33 Scale 组 件 (一 ) 
def show(): 


print(sl.get(), s2.get()) 
Button(root, text = "Jkí8 [V EL", command = show). pack( ) 


mainloop() 


程序 实现 如 图 15-34 所 示 。 
可 以 通过 resolution 选项 控制 分 辨 率 ( 步 长 ) ,通过 tickinterval 选 
项 设置 刻度 : 


i p15_23. py 
from tkinter import * 


root = Tk() 
Scale(root, from_= 0, to- 42, tickinterval - 5, length = 200, \ 
resolution = 5, orient = VERTICAL). pack( ) 图 15-34 Scale 组 件 ( 二 ) 
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Scale(root, from = 0, to- 200, tickinterval = 10, length- 600, V 
orient = HORIZONTAL). pack( ) 


mainloop() 


程序 实现 如 图 15-35 所 示 , 


f tk 
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图 15-35 Scale 组 件 ( 三 ) 


115.11 Text 28 4 
r 


Listbox 组 件 , 输 入 框 使 用 Entry 组 件 , 按钮 使 用 Button 组 件 , 还 有 Radiobutton 和 
Checkbutton 组 件 用 于 提供 单 选 或 多 选 的 情况 。 多 个 组 件 可 以 用 Frame 组 件 先 搭 建 一 个 框 
染 ,这 样 组 织 起 来 会 更 加 有 条 不 亲 。 最 后 还 学 习 了 两 个 会 深 动 的 组 件 : Scrollbar 和 Scale, 
Scrollbar 组 件 用 于 实现 滚动 条 ,而 Scale 则 是 让 用 户 在 一 个 范围 内 选择 一 个 确定 的 值 。 

Text( 文 本 ) 组 件 用 于 显示 和 处 理 多 行文 本 。 在 Tkinter 的 所 有 组 件 中 ,Text 组 件 显得 异 
党 强大 和 灵活 , 它 适 用 于 处 理 多 种 任务 。 虽 然 该 组 件 的 主要 目的 是 显示 多 行文 本 ,但 它 和 常常 也 
被 用 于 作为 简单 的 文本 编辑 顺和 网 页 浏览 硕 使 用 。 

当 创 建 一 个 Text 组 件 的 时 候 , 它 里 面 是 没有 内 容 的 。 为 了 给 其 插入 内 容 , 可 以 使 用 
insert() 方 法 以 及 INSERT 或 END 索引 号 : 


# pl5 24.py 
from tkinter import * 


root - Tk() 
text = Text(root, width= 30, height = 2) 
text. pack( ) 

* INSERT 索引 表示 插入 光标 当前 的 位 置 
text. insert(INSERT, "I love\n") 

text. insert(END, "FishC. com! ”) 


mainloop() 
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程序 实现 如 图 15-36 所 示 。 
Text 组 件 不 仅 文 持 插入 和 编辑 文本 , 它 还 文 持 插入 image 对 象 和 window 组 件 : 


# p15_25. py 
from tkinter import * 


root = Tk() 
text = Text(root, width= 20, height= 5) 
text. pack( ) 


text. insert( INSERT, "I love FishC. com! ") 


def show(): 
print(" 哟 ,我 被 点 了 一 下 一 ”) 


bl = Button(text，text =" ARAR", command = show) 
text.window create(INSERT, window = bl) 


mainloop() 


程序 实现 如 图 15-37 所 示 。 
下 面 的 代码 将 实现 单 击 一 下 按钮 显示 一 张 图 片 的 功能 : 


# pl5 26. py 
from tkinter import * 


root - Tk() 
text = Text(root, width= 30, height = 10) 
text. pack( ) 


text. insert( INSERT, "I love FishC. com! ") 
photo = Photolmage(file- 'fishc.gif") 


def show(): 
text. image create(END, image = photo) 


bl = Button(text, text - "jh R dk", command = show) 
text.window create(INSERT, window - bl) 


mainloop() 


程序 实现 如 图 15-38 所 示 。 


I love FishC. con! 


LI 


fk 


I lovs FISHC.COM 
3E com! 


图 15-36 Text 组 件 ( 一 ) 图 15-37 Text 组 件 ( 二 ) 图 15-38 Text 组 件 ( 三 ) 
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15.11.1 Indexes 用 法 


Indexes 5D E HIoK dH I] Text 组 件 中 文本 的 位 置 , 跟 Python 的 序列 索引 一 样 ,Text 组 
件 索 引 也 是 对 应 实际 字符 之 间 的 位 置 。 
Tkinter 提供 一 系列 不 同 的 索引 类 型 : 


15 


"line. column" (fT/ 7M , 

"line. end"( 某 一 行 的 末尾 )。 

INSERT, 

CURRENT, 

END, 

user-defined marks, 

user-defined tags("tag. first" ." tag. last"), 
selectionC SEL FIRST.SEL LAST), 
window coordinate(" (OQ x, y") , 

embedded object name( window .images) , 


expressions, 


"line. column" 


用 行 号 和 列 号 组 成 的 字符 串 是 常用 的 索引 方式 ,它们 将 索引 位 置 的 行 号 和 列 号 以 字符 串 
的 形式 表示 出 来 (中 间 以 ". "分 隔 , 例 如 "1.0")。 需 要 注意 的 是 , 行 号 以 1 开始 , 列 号 则 以 0 JF 
始 。 还 可 以 使 用 以 下 语法 构建 索引 : 

"S&d. $d" % (line, column) 

指定 超出 现 有 文本 的 最 后 一 行 的 行 号 ,或 超出 一 行 中 列 数 的 列 号 都 不 会 引发 错误 。 对 于 
这 样 的 指定 ,Tkinter 解释 为 已 有 内 容 的 末尾 的 下 一 个 位 置 。 

需要 注意 的 是 ,使 用 * 行 / 列 ? 的 索引 方式 看 起 来 像 是 浮 点 值 。 其 实在 需要 指定 索引 的 时 候 
使 用 浮 点 值 代 蔡 也 是 可 以 的 : 


text. insert(INSERT, "I love FishC") 
print(text.get("1.2", 1.6)) 


程序 实现 如 图 15-39 所 示 。 


ue. 


"line. end" 


行 号 加 上 字符 串 ".end" 的 格式 表示 为 该 行 最 后 一 个 字符 的 位 置 : 


text. insert(INSERT, "I love FishC") 
print(text.get("1.2", "1.end")) 


程序 实现 如 图 15-40 所 示 。 


3. 


INSERT ( &" insert") 


对 应 插入 光标 的 位 置 。 
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0 tk 


I love FishC 


r] tk 


| love FishC 


>>> 
love 


>>> 
love FishC 


15-39 Text £B f/F Cpu) 图 15-40 Text zB f/F C) 


4. CURRENT ( E" current") 


对 应 与 鼠标 坐标 最 接近 的 位 置 。 不 过 ,如 采 你 紧 按 鼠标 任何 一 个 按钮 ,会 直到 你 松 开 它 才 
We] Ji 。 


5. ENDCE" end") 
对 应 Text 组 件 的 文本 缓冲 区 最 后 一 个 字符 的 下 一 个 位 置 。 
6. user-defined marks 


user-defined marks 是 对 Text 组 件 中 位 置 的 命名 。INSERT 和 CURRENT 是 两 个 预先 
命名 好 的 marks, 除 此 之 外 可 以 自 定 义 marks, 


7. User-defined tags 


User-defined tags 代表 可 以 分 配给 Text 组 件 的 特殊 事件 绑 定 和 风格 。 
可 以 使 用 "tag. first"( 使 用 tag 的 文本 的 第 一 个 字符 之 前 ) 和 "tag. last" (使 用 tag 的 文本 
的 最 后 一 个 字符 之 后 ) 语 法 表示 标签 的 范围 : 


"£*s.first" % tagname 
"£€s.last" % tagname 


8. selection( SEL FIRST.SEL LAST) 


selection 是 一 个 名 为 SEL( 或 "sel") 的 特殊 tag, 表 示 当 前 被 选中 的 范围 ,可 以 使 用 SEL_ 
FIRST 到 SEL LAST 来 表示 这 个 范围 。 如 果 没 有 选中 的 内 容 , 那 么 Tkinter 会 抛 出 一 个 
TclError 异常 。 


9. window coordinate(" @x.,y") 


可 以 使 用 窗口 坐标 作为 索引 。 例 如 在 一 个 事件 绑 定 中 ,你 可 以 使 用 以 下 代码 找到 最 接近 
鼠标 位 置 的 字符 : 


"@ $ d, $d" % (event.x, event. y) 


10. embedded object name (window. images) 
embedded object name 用 于 指 回 在 Text £H fF'P i AJ window 和 image 对象。 要 引用 
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一 个 window, 只 要 简单 地 将 一 个 Tkinter 组 件 实例 作为 索引 即 可 。 引 用 一 个 短信 的 image. H 
需 使 用 相应 的 PhotoImage 和 BitmapImage XJ £ , 


11. expressions 


expressions 用 于 修改 任何 格式 的 索引 ,用 字符 串 的 形式 实现 修改 索引 的 表达 式 。 具 体 表 
达 式 实现 如 表 15-3 所 示 。 
X 15-3 expressions 
表达 式 * 义 


"+ count chars" | 将 索引 辕 前 (- 二 ) 移 动 count 个 字符 。 可 以 越过 换行 符 , 但 不 能 超过 END 的 位 置 

"- count chars" | 将 索引 回 后 (一 -) 移 动 count 个 字符 。 可 以 越过 换行 符 , 但 不 能 超过 "1.0" 的 位 置 

ee et iia 将 索引 向 前 (- 盖 ) 移 动 count 行 。 索 引 会 尽量 保持 与 移动 前 在 同一 列 上 ,但 如 果 移 动 后 
的 那 一 行 字符 太 少 ,将 移动 到 该 行 的 末尾 
将 索引 向 后 (二 -) 移 动 count 行 。 索 引 会 尽量 保持 与 移动 前 在 同一 列 上 ,但 如 果 移 动 后 


的 那 一 行 字符 太 少 ,将 移动 到 该 行 的 末尾 


" . " 
- count lines 


" linestart" 将 索引 移动 到 当前 索引 所 在 行 的 起 始 位 置 。 注 意 : 使 用 该 表达 式 前 边 必须 用 一 个 空格 隔 开 

" lineend" 将 索引 移动 到 当前 索引 所 在 行 的 未 尾 。 注 意 : 使 用 该 表达 式 前 边 必须 用 一 个 空格 隔 开 

,jn | 将 索引 移动 到 当前 索引 指向 的 单词 的 开头 。 单 词 的 定义 是 一 系列 字母 数字、 下 划 线 或 
任何 非 空白 字符 的 组 合 。 注 意 : 使 用 该 表达 式 前 边 必须 用 一 个 空格 隔 开 

S 将 索引 移动 到 当前 索引 指向 的 单词 的 末尾 。 单 词 的 定义 是 一 系列 字母 .数字 、 下 划 线 或 
任何 非 空白 字符 的 组 合 。 注 意 : 使 用 该 表达 式 前 边 必须 用 一 个 空格 隔 开 

M 


只 要 结果 不 产生 歧义 ,关键 宁可 以 被 缩写 ,空格 也 可 以 省 略 。 例 如 ， "十 5 chars" T 9A 


简 写成 "十 5c" 。 


在 实现 中 ,为 了 确保 表达 式 为 普通 字符 串 , 你 可 以 使 用 str 或 格式 化 操作 来 创建 一 个 表达 
式 字 符 串 。 下 面 例子 演示 了 如 何 删 除 插入 光标 前 面 的 一 个 字符 : 


def backspace( event) : 
event.widget.delete(" % s— 1c" % INSERT, INSERT) 


15.11.2 Marks 用 法 


Marks br it 388 9$ Je SCA f Text 组 件 文本 中 的 不 可 见 对 象 。 事 实 上 ,Marks 是 指定 字符 
间 的 位 置 ,并 跟随 相应 的 字符 一 起 移动 。Marks 有 INSERT, CURRENT 和 user-defined 
marks( 用 户 目 定义 的 Marks)。 其 中 ,INSERT 和 CURRENT Æ Tkinter 预定 义 的 特殊 
Marks ,它们 不 能 够 被 删除 。 

INSERT( 或 "insert") 用 于 指定 当前 插入 光标 的 位 置 ,Tkinter 会 在 该 位 置 绘 制 一 个 闪烁 
的 光标 (因此 并 不 是 所 有 的 Marks 都 不 可 见 ) 。 

CURRENT( 或 "current") 用 于 指定 与 鼠标 坐标 最 接近 的 位 置 。 不 过 ,如 果 你 紧 按 鼠标 任 
何 一 个 按钮 , 它 会 直到 你 松 开 它 才 啊 应 。 

还 可 以 自 定 义 任意 数量 的 Marks, Marks 的 名 字 是 由 普通 字符 串 组 成 ,可 以 是 除了 空白 字 
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符 外 的 任何 字符 (为 了 避免 歧义 ,你 应 该 起 一 个 有 意义 的 名 字 )。 使 用 mark_set() 方 法 创建 和 
移动 Marks, 

如 果 在 一 个 Mark 标记 的 位 置 之 前 插入 或 删除 文本 ,那么 Mark 跟着 一 并 移动 。 删 除 
Marks 需要 使 用 mark_unset() 方 法 ,删除 Mark 周围 的 文本 并 不 会 删除 Mark #4. 

例 1: Mark 事实 上 就 是 索引 ,用 于 表示 位 置 : 

text. insert(INSERT, "I love FishC") 

text.mark set("here", "1.2") 

text. insert("here", "jf") 

程序 实现 如 图 15-41 所 示 。 

例 2: 如 果 Mark 前 边 的 内 容 发 生 改 变 , 那 么 Mark 的 位 置 也 会 跟着 移动 (实际 上 ,就 是 
Mark 会 “ 记 住 ” 它 后 边 的 “ 那 家 伙 ”): 

text. insert( INSERT, "I love FishC") 

text.mark set("here", "1.2") 


text. insert("here", "jüi") 
text. insert("here", " A") 


程序 实现 如 图 15-42 所 示 。 


//«* -CER 1 «* -cEN 


I 插 love FishC I RE Alove FishC 
图 15-41 Text 组 件 ( 六 ) 图 15-42 ”Text 组 件 ( 七 ) 


例 3: WR Mark 周围 的 文本 被 删除 了 ,Mark 仍然 还 在 : 


text. insert(INSERT, "I love FishC") 
text.mark set("here", "1.2") 

text. insert("here", "jf") 
text.delete("1.0", END) 

text. insert("here", "A") 


程序 实现 如 图 15-43 Brzn 
| sn 
例 4: 只 有 mark_unset() 方 法 可 以 解除 Mark 的 d tk EET 
BED ^ 


text. insert(INSERT, "I love FishC") 
text.mark set("here", "1.2") 

text. insert("here", "jg" 

l " * | 15-43 Text 组 件 ( 八 ) 
text. mark unset("here") 

text.delete("1.0", END) 

text. insert("here", "A") 


程序 实现 如 图 15-44 所 示 。 
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132, Oct 6 2014, 22:16:31) [MSC v 
ense()' for more information. 


>>> 
Traceback (most recent call last): 


File "CNUsers\ 佳 于 \OneDrive\ 练 习 \t8.py line 15, in «module» 
text.insert("here", "入 ") 
File "C\Python3A\lib\tkinten\ init .py", line 3140, in insert 
self.tk.call((self. w, 'insert', index, chars) + args) 
 tkinter.TclError: bad text index "here" 


>>> 


图 15-44 Text tH fF CJL) 


默认 插入 内 容 到 Mark ,是 插入 到 它 的 左 侧 (就 是 说 插入 一 个 字符 的 话 ,Mark I ja £2 3 E 
一 个 字符 的 位 置 )。 那 么 能 不 能 插入 到 Mark 的 右 侧 呢 ?” 其 实 是 可 以 的 ,通过 mark gravity O 
方法 就 可 以 实现 。 


例 5( 对 比例 25. 
à; i ! « -cEm 


text. insert(INSERT, "I love FishC") I 入 插 love Fishc 
text.mark set("here", "1.2") 

text.mark gravity("here", LEFT) 

text. insert("here", "jüi") 

text. insert("here", "A") 


示 图 15-45 Text 组 件 ( 十 ) 
程序 实现 如 图 15-45 所 示 。 ext 


15.11.3 Tags 用 法 
Tags( 标 签 ) 通 常用 于 改变 Text 组 件 中 内 容 的 样式 和 功能 。 可 以 用 来 修改 文 国字 7 
本 的 字体 尺寸 和 颜色 。 另 外 ,Tags 还 允许 将 文本 、. 藤 入 的 组 件 和 图 片 与 键盘 和 鼠标 等 事件 相 
关联 。 除 了 user-defined tags( 用 户 自 定义 的 Tags ,还 有 一 个 预定 义 的 特殊 Tag: SEL. 

SEL( 或 "sel") 用 于 表示 对 应 的 选中 内 容 ( 如 果 有 的 话 )。 

可 以 自 定义 任意 数量 的 Tags. Tags 的 名 字 是 由 普通 字符 串 组 成 ,可 以 是 除了 空 日 字符 外 
的 任何 字符 。 另 外 ,任何 文本 内 容 都 支持 多 个 Tags 描述 ,任何 Tags 也 可 以 用 于 描述 多 个 不 
同 的 文本 内 容 。 

为 指定 文本 添加 Tags 可 以 使 用 tag_add() 方 法 : 


# pl5 26. py 
from tkinter import * 


root - Tk() 
text = Text(root, width= 30, height = 5) 
text. pack( ) 


text. insert( INSERT, "I love FishC. com! ") 
text.tag add("tagl", "1.7", "1.12", "1.14") 
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text. tag config ( " tagl", 
foreground = "red") 


mainloop() 


程序 实现 如 图 15-46 所 示 。 
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background = " yellow", 


I love FishC. con! 


如 上 ,使 用 tag_config() 方 法 可 以 设置 Tags 的 样式 。 


K 15-4 列举 了 tag _congif() 方 法 可 以 使 用 的 选项 。 


选 q 


background 


bgstipple 


borderwidth 


fgstipple 


font 


foreground 


justify 


Imarginl 


Imargin2 


offset 
overstrike 
relief 


rmargin 
spacingl 
spacing2 
spacing3 


tabs 


underline 


wrap 
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X 15-4 tag_config() 方 法 可 以 使 用 的 选项 
含 X 

指定 该 Tag 所 描述 的 内 容 的 背景 颜色 。 注 意 : bg 并 不 是 该 选项 的 缩写 ,在 这 里 bg 被 解释 为 
bgstipple 选项 的 缩写 
指定 一 个 位 图 作为 背景 ,并 使 用 background 选项 指定 的 颜色 填充 。 只 有 设置 了 background 
选项 该 选项 才 会 生效 。 默 认 的 标准 位 图 有 'error'、'gray75'、'gray50'、'gray25'、'gray12'、 
'hourglass'、'info'、'questhead'、'guestion' 和 'warning' 
指定 文本 框 的 宽度 ,默认 值 是 0, 只 有 设置 了 relief 选项 该 选项 才 会 生效 。 注 意 : 该 选项 不 能 
使 用 bd 缩写 
指定 一 个 位 图 作为 前 景色 ,默认 的 标准 位 图 有 'error'、'gray75'、'gray50'、'gray25'、'gray12'、 
'hourglass', info', 'questhead', 'question' fI warning" 
指定 该 Tag 所 描述 的 内 容 使 用 的 字体 
指定 该 Tag 所 描述 的 内 容 的 前 景色 。 注 意 : fg 并 不 是 该 选项 的 缩写 ,在 这 里 fg 被 解释 为 
fgstipple 选项 的 缩写 
控制 文本 的 对 齐 方式 ,默认 是 LEFT( 左 对 齐 ) ,还 可 以 选择 RIGHT( 右 对 齐 ) 和 CENTER CO 
中 )。 注 意 : 需要 将 Tag 指 回 该 行 的 第 一 个 字符 ,该 选项 才能 生效 
设置 Tag 指向 的 文本 块 第 一 行 的 缩 进 ,默认 值 是 0。 注 意 : 需要 将 Tag 指向 该 文本 块 的 第 一 
个 字符 或 整个 文本 块 ,该 选项 才能 生效 
设置 Tag 指向 的 文本 块 除 了 第 一 行 其 他 行 的 缩 进 ,默认 值 是 0。 注 意 : 需要 将 Tag 指向 整个 
文本 块 , 该 选项 才能 生效 
设置 Tag 指向 的 文本 相对 于 基线 的 偏 移 距 离 。 可 以 控制 文本 相对 于 基线 是 升 高 ( 正 数值 ) 或 
者 降低 (负数 值 ) ,默认 值 是 0 
在 Tag 指定 的 文本 范围 画 一 条 删除 线 ,默认 值 是 False。 
指定 Tag 对 应 范围 的 文本 的 边框 样式 。 可 以 使 用 的 值 有 : SUNKEN, RAISED, GROOVE, 
RIDGE 或 FLAT ,默认 值 是 FLAT( 没 有 边框 ) 
设置 Tag 指向 的 文本 块 右 侧 的 缩 进 ,默认 值 是 0 
设置 Tag 所 描述 的 文本 块 中 每 一 行 与 上 方 的 空白 间隔 ,默认 值 是 0。 注意 : 自动 换行 不 算 
设置 Tag 所 描述 的 文本 块 中 自动 换行 的 各 行 间 的 空白 间隔 ,默认 值 是 0。 注意: 换行 符 (\n') 不 算 
设置 Tag 所 描述 的 文本 块 中 每 一 行 与 下 方 的 空白 间隔 ,默认 值 是 0。 注意 : 自动 换行 不 算 
定制 Tag 所 描述 的 文本 块 中 Tab 按键 的 功能 ,默认 Tab 被 定义 为 8 个 字符 的 宽度 
还 可 以 定义 多 个 制 表 位 : tabs= 二 ('3c'，'5c'，'12c') ,表示 前 3 个 Tab 宽度 分 别 为 3 厘米 、5 JH 
X12 厘米 ,接着 的 Tab 按照 最 后 两 个 的 差 值 计 算 , 即 19 厘米 .26 厘米 、33 厘米 
注意 ,'c' 的 含义 是 “厘米 ”而 不 是 “字符 ”, 还 可 以 选择 的 单位 有 'i'( 英 寸 )、'm'( 毫 米 ) 和 'p'(DPTI， 
大 约 是 '1i' 等 于 "72p') 如 果 是 一 个 整 型 值 , 则 单位 是 像素 
若 该 选项 设置 为 True 的 话 , 则 Tag 所 描述 的 范围 内 文本 将 被 加 上 下 划 线 。 默 认 值 是 False 
设置 当 一 行文 本 的 长 度 超 过 width 选项 设置 的 宽度 时 ,是 否 自动 换行 。 该 选项 的 值 可 以 是 
NONE( 不 目 动 换行 )\CHAR( 按 字符 自动 换行 ) 和 WORD( 按 单词 自动 换行 ) 


第 ID 章 ” GUI 的 最 终 选 择 ，Tkinter |P 


如 果 对 同一 个 范围 内 的 文本 加 上 多 个 Tags, 并 且 设 置 相同 的 选项 ,那么 新 创建 的 Tag 样 
式 会 覆盖 比较 旧 的 Tag: 


text. tag config("tagl", background = "yellow", foreground = "red") # IHHS Tag 
text. tag config("tag2", foreground = "blue") # 新 的 Tag 

# 那么 新 创建 的 Tag2 会 覆盖 比较 旧 的 Tagl 的 相同 选项 

# 注意 ,与 下 边 的 调用 顺序 没有 关系 

text. insert(INSERT, "I love FishC.com!", ("tag2", "tagl")) 


程序 实现 如 图 15-47 所 示 。 
可 以 使 用 tag_raise() 和 tag_lower() 方 法 来 提高 和 降低 某 个 Tag 的 优先 级 : 


text. tag config("tagl", background = "yellow", foreground = "red") 
text.tag config("tag2", foreground - "blue") 

text.tag lower("tag2") 

text. insert( INSERT, "I love FishC.conm!", ("tag2", "tagl")) 


程序 实现 如 图 15-48 所 示 。 


//«* -coEB 1 « -OES 


I love FishC. con! I love FishC. con! 


图 15-47 Text 组 件 ( 十 二 ) 图 15-48 Text 组 件 ( 十 三 ) 


Tags 还 支持 事件 绑 定 , 绑 定 事件 使 用 的 是 tag_bind() 的 方法 。 下 面 例子 将 文本 ("FishC. 
com'") 与 鼠标 事件 进行 绑 定 , 当 鼠 标 进 入 该 文本 段 的 时 候 , 鼠 标 样 式 切 换 为 "arrow" 形 态 ,离开 
文本 段 的 时 候 切 换 回 "xterm "形态 。 当 触发 展 标 * 左 键 单 击 操作 ”事件 的 时 候 , 使 用 默认 浏览 
ArT F fa C 工作 室 的 首页 (www. fishc. com): 


# pl5 27.py 
from tkinter import * 
import webbrowser 


root - Tk() 
text = Text(root, width= 30, height = 5) 
text. pack( ) 


text. insert( INSERT, "I love FishC. com! ") 
text.tag add("link", "1.7", "1.16") 
text. tag config("link", foreground = "blue", underline = True) 


def show hand cursor(event): 
text.config(cursor = "arrow") 


def show arrow cursor(event): 
text.config(cursor = "xterm") 


def click(event): 
webbrowser. open(" http: //www. fishc.com") 
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text.tag bind("link", "«Enter»", show hand cursor) 
text. tag bind("link", "< Leave>", show arrow cursor) 
text.tag bind("link", "< Button- 1»", click) 


mainloop() 


程序 实现 如 图 15-49 所 示 。 

最 后 ,给 大 家 介绍 几 个 Text 组 件 使 用 上 的 技巧 , 非 
Tí 3: Hb. 

第 一 个 是 判断 内 容 是 否 发 生变 化 ,比如 做 一 个 记事 
本 程序 , 当 用 户 关 闭 的 时 候 , 程 序 应 该 检查 内 容 是 否 有 改 
变 , 如 果 有 变化 ,应 该 提醒 用 户 保存 。 在 下 面 的 例子 中 ， 图 15-49 Text 组件 ( 十 四 ) 
通过 校 检 Text 组 件 中 文本 的 MD5 摘要 来 判断 内 容 是 否 

# pl5 28.py 


from tkinter import * 
import hashlib 


I love FishC. con! 


root - Tk() 
text = Text(root, width- 20, height = 5) 
text. pack( ) 


text. insert(INSERT, "I love FishC. com! ") 
contents - text.get(1.0, END) 


def getSig(contents): 
m = hashlib.md5(contents. encode( ) ) 
return m. digest() 


sig = getSig(contents) 


def check( ) : 
contents - text.get(1.0, END) 
if sig != getSig(contents): 
print(" 警 报 : 内 容 发 生变 动 !") 
else: 


print(" 风 平 浪 静 一 ") 
Button(root, text = "KØ", command = check). pack() 


mainloop() 


程序 实现 如 图 15-50 所 示 。 

第 二 个 例子 是 查找 操作 ,使 用 search() 方 法 可 以 搜索 Text 组 件 中 的 内 容 。 可 以 提供 一 个 
确切 的 目标 进行 搜索 (默认 ) ,也 可 以 使 用 Tcl 格式 的 正则 表达 式 进 行 搜索 ( 需 设 置 regexp 选 
项 为 True): 


# pl5 29.py 
from tkinter import * 
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I love FishC. com! 
Duang 


L1 


风平浪静 ~ _、 警报 : 内 容 发 生变 动 


图 15-50 Text 组件 (十 五 ) 


root = Tk() 
text = Text(root, width= 30, height = 5) 
text. pack( ) 


text. insert(INSERT, "I love FishC. com!") 


# 将 任何 格式 的 索引 号 统一 为 元 组 (f, 90) 的 格式 输出 
def getIndex(text, index): 
return tuple(map(int, str.split(text. index(index), "."))) 


start - 1.0 
while True: 
pos = text.search("o", start, stopindex = END) 
if not pos: 
break 
print(" 找 到 啦 , 位 置 是 : ", getIndex(text, pos)) 
start = pos + "-*1c" # 将 start 指向 下 一 个 字符 


mainloop() 


程序 实现 如 图 15-51 所 示 。 

如 果 和 忽略 stopindex 选项 ,表示 直到 文本 的 末尾 结 
RR., RE backwards 选项 为 True, 则 是 修改 搜索 的 
方向 ( 变 为 向 后 搜索 ,那么 start 变量 应 该 设置 为 END， 
stopindex 选项 设置 为 1.0, 最 后 "十 lc" 改 为 "一 1c")。 

最 后 ,Text 组 件 还 支持 “恢复 ”和 “撤销 ”操作 ,这 使 [777 
得 Text 组 件 显得 相当 高 大 上 。 通 过 设置 undo 选项 为 | 找到 啦 ,位 是 是 : (1, 3) 
True 可 以 开启 Text 组 件 的 “撤销 ”功能 ,然后 用 edit, DAM UAE: (1, M) 


I love FishC. con! 


undo() 方 法 实现 “撤销 ”操作 ,用 edit. redo O 7r i: SE 图 15-51 Text 组件 (十 六 ) 
“恢复 ?操作 。 
# p15_30. py 


from tkinter import * 


root = Tk() 
text = Text(root, width= 30, height= 5, undo = True) 
text. pack( ) 


text. insert(INSERT, "I love FishC") 
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def show( ) : 
text.edit undo() 


Button(root, text = "撤销 "，command = show). pack() 


mainloop() 
这 是 因为 Text 组 件 内 部 有 一 个 栈 专门 用 于 记录 内 容 的 每 次 变动 ,所 以 每 次 “撤销 ”操作 
就 是 一 次 弹 栈 操作 恢复 ?就 是 再 次 压 栈 。 如 图 15-52 所 示 。 


15-52 Text AH fF CT ED 


默认 情况 下 ,每 一 次 完整 的 操作 都 会 放 入 栈 中 。 但 怎么 样 算是 一 次 完整 的 操作 呢 ? 
Tkinter 觉得 每 次 焦点 切换 ,用户 按 下 回 车 键 、 删 除 / 插 和 人 操作 的 转换 等 之 前 的 操作 算是 一 次 
完整 的 操作 。 也 就 是 说 ,你 连续 输入 “FishC 是 个 了 的话 ,一 次 "撤销 ?操作 就 会 将 所 有 的 内 容 


删除 。 
那 能 不 能 目 定 义 呢 ? 比如 布 望 插入 一 个 字符 就 算 一 次 完整 的 操作 ,然后 每 次 单 击 “ 撤 销 ” 
就 去 掉 一 个 字符 。 


当然 可 以 ! 做 法 就 是 先 将 autoseparators 选项 设置 为 False( 因 为 这 个 选项 是 让 Tkinter 
在 认为 一 次 完整 的 操作 结束 后 自动 插入 “分 隐 符 ”) ,然后 绑 定 键盘 事件 ,每 次 有 输入 就 用 edit_ 
separator() 方 法 人 为 地 插入 一 个 “分 隅 符 ”: 


# pl5 31.py 
from tkinter import * 


root - Tk() 
text = Text(root, width= 30, height = 5, autoseparators = False, undo = True, maxundo = 10) 
text. pack( ) 


def callback(event): 
text.edit separator() 
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text. bind( '< Key >', callback) 
text. insert(INSERT, "I love FishC") 


def show(): 
text.edit undo() 


Button(root, text = "JH Hi", command = show).pack() 


mainloop() 


45.1 2 Canvas 组 件 


H FZR AEDE., WAT Sb e YR Dx 2A Bl Br X Ha, K 22 d] e 41138 2 hy 

Canvas 组 件 ,是 一 个 可 以 让 你 任性 的 组 件 , 一 个 可 以 让 你 随心 所 谷地 绘制 界面 的 组 件 。 
Canvas 是 一 个 通用 的 组 件 , 它 通 常用 于 显示 和 编辑 图 形 。 可 以 用 它 来 绘制 耳 线 、 圆 形 、 多 边 
形 ,甚至 是 绘制 其 他 组 件 。 

在 Canvas 组 件 上 绘制 对 象 , 可 以 用 create xxx() 的 方法 (xxx 表示 对 象 类 型 ,例如 直线 


line, 4HJÉ rectangle 和 文本 text 等 ) ; 


# pl5 32.py 
from tkinter import * 


root - Tk() 
w = Canvas(root, width- 200, height = 100) 


w.pack() 
# 画 一 条 黄色 的 横 线 
w.create line(0, 50, 200, 50, fill = "yellow") 


# 男 一 条 红色 的 竖 线 (虚线 ) 
w.create line(100, 0, 100, 100, fill- "red", dash- (4, 4)) 


£ 中 间 画 一 个 蓝 色 的 和 矩形 
w.create rectangle(50, 25, 150, 75, fill- "blue") 


mainloop() 

程序 实现 如 图 15-53 所 示 。 f tk 

注意 ,添加 到 Canvas 上 的 对 象 会 一 直 保 留 着 。 如 果 你 和 希望 
修改 它们 ,你 可 以 使 用 coordsO ,itemconfig O fll move() 方 法 来 
移动 画布 上 的 对 象 ,或 者 使 用 delete() 方 法 来 删除 : 


# p15_33. py 

ai 图 15-53 Canvas 组件 (一 ) 
linel = w.create line(0, 50, 200, 50, fill = "yellow") 

line2 = w.create line(100, 0, 100, 100, fill= "red", dash- (4, 4)) 

rectl = w.create rectangle(50, 25, 150, 75, fill- "blue") 

w.coords(linel, 0, 25, 200, 25) 

w.itemconfig(rectl, fill = "red") 

w.delete(line2) 
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Button(root，text = "删除 全 部 "，command = (lambda x= ALL : w.delete(x))). pack() 


程序 实现 如 图 15-54 所 示 。 
还 可 以 在 Canvas 上 显示 文本 ,使 用 的 是 create_text() 方 法 : 


# pl5 34.py 


w.create line(0, 0, 200, 100, fill = "green", width= 3) 
w.create line(200, 0, 0, 100, fill- "green", width= 3) 
w.create rectangle(40, 20, 160, 80, fill- "green") 
w.create rectangle(65, 35, 135, 65, fill- "yellow") 
w.create text(100, 50, text - "FishC") 


程序 实现 如 图 15-55 所 示 。 


1 tk -ES 


1 tk -OES 


删除 全 部 
图 15-54 Canvas fH fF C 图 15-55 Canvas 组 件 ( 三 ) 
使 用 create oval O Jr ik £z dil Wf RUE Cox [8] JE ,参数 是 指定 一 个 限定 矩形 (Tkinter 会 自动 
在 这 个 矩形 内 绘制 一 个 椭圆 ) : 
# p15 35.py 
w.create rectangle(40, 20, 160, 80, dash- (4, 4)) 


w.create oval(40, 20, 160, 80, fill = "pink") 
w.create text(100, 50, text - "FishC") 


程序 实现 如 图 15-56 所 示 。 
而 绘制 圆 形 就 是 把 限定 矩形 设置 为 正方 形 即 可 : 


w.create oval(70, 20, 130, 80, fill = "pink") 


程序 实现 如 图 15-57 所 示 。 


x f 


15-56 Canvas 组 件 ( 四 ) 图 15-57 Canvas 组 件 ( 五 ) 
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如 果 想 要 绘制 多 边 形 ,可 以 使 用 create_polygon() 方 法 。 好 ,现在 带 大 家 来 画 一 个 五 角 
星 。 首 先 , 要 先 确 定 五 个 角 的 坐标 。 那 么 高 中 数学 不 是 体育 老师 教 的 鱼油 们 应 该 看 得 懂 这 张 
图 (看 不 懂 也 没关系 哈 ,知道 结果 就 行 , 因 为 现在 的 目标 是 用 Tkinter 画 五 角 星 ,而 不 是 学 三 角 


函数 ) ,如 图 15-58 所 示 。 


# pl5 36.py 
from tkinter import * 
import math as m 


root = Tk() 


ptCenter 
(x, y) 


E D 
rl = R * sin(2 * PI / 5) 
r2 = R * cos(2 * PI / 5) 
xlzx-rlzx-R*sin(2* Pl/ 5) 
yl-y-r2-y-R*cos(2 * PI / 5) 


图 15-58 Canvas AH fF CAD 


w = Canvas(root, width- 200, height = 100, background = "red") 


w. pack( ) 
center x 


100 
center y = 50 
r = 50 
points = [ 

# 左上 点 


center x — 


S 
— 
= 
* 


* 


center y - int(r 
# 右上 点 


center x + 


ii 
= 
x 


* 


center y 一 int(r 
# 左下 点 


center x - int(r 


* 
B 


* 
B 


center y * int(r 
# 顶点 
center x, 
center y - r, 
HAFA 


center_x + int(r * 


* 
B 


center y + int(r 


] 


.sin(2 * m.pi / 5)), 
.cos(2 * m.pi / 5)), 


.sin(2 * m.pi / 5)), 
.cos(2 * m.pi / 5)), 


. sin(m. pi / 5)), 
.cos(m. pi / 5)), 


. sin(m. pi / 5)), 
.cos(m. pi / 5)), 


w.create polygon(points, outline = "green", fill = "yellow") 
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mainloop() 


程序 实现 如 图 15-59 所 示 。 


1 tk -OES 


Dag 


让 用 户 可 以 在 上 面 随心 所 欲 地 绘画 ,如 图 15-60 所 示 。 
其 实 实现 原理 也 很 简单 ,就 是 获取 用 户 拖 动 鼠 标的 坐标 ,然后 
每 个 坐标 对 应 绘制 一 个 点 上 去 就 可 以 了 。 在 这 里 ,不 得 不 承认 有 
a 图 15-59 Canvas 组 件 ( 七 ) 
点 遗憾 让 人 的 是 Tkinter 并 没有 提供 画 " 点 ”的 方法 。 
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KI 15-60 Canvas 组 件 ( 八 ) 
但 是 程序 是 死 的 ,程序 员 是 活 的 ! 可 以 通过 绘制 一 个 超 小 的 椭圆 形 来 表示 一 个 “点 ”。 在 
下 面 的 例子 中 ,通过 响应 “鼠标 左 键 按 住 拖 动 * 事 件 (一 BlL-Motion 二 ) ,在 鼠标 拖 动 的 同时 获取 
鼠标 的 实时 位 置 (x, y) ,并 绘制 一 个 超 小 的 椭圆 来 代表 一 个 “点 ”; 


# pl5 37.py 
from tkinter import * 


root - Tk() 
w = Canvas(root, width- 400, height = 200) 


w. pack( ) 
def paint(event): 
xl, yl = (event.x - 1), (event.y - 1) 


x2, y2 = (event.x + 1), (event.y + 1) 
w.create oval(xl, yl, x2, y2, fill- "red") 


w. bind("« B1 - Motion»", paint) 
Label(root, text = " 按 住 鼠 标 左 键 并 移动 ,开始 绘制 你 的 理想 蓝图 吧 .…… "). pack(side = BOTTOM) 


mainloop() 


程序 实现 如 图 15-61 Wr. 
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fish C 


按 住户 标 左 键 并 移动 ,开始 绊 制 你 的 理想 蓝图 吧 ..…… 


图 15-61 Canvas 组 件 ( 九 ) 
关于 男 布 对 象 还 有 些 概念 ,我 们 觉得 必须 了 解 , 这 里 给 大 家 做 个 总 结 : 
1. Canvas 组 件 支 持 的 对 象 。 


arc( 弧 形 . 75 SX JE . 
bitmap( 内 建 的 位 图 文件 或 XBM 格式 的 文件 ) 。 

* image(BitmapImage 或 PhotoImage 的 实例 对 象 ) 。 

* line( 线 ) 。 

* oval( 圆 或 椭圆 形 )。 

* polygon( 多 边 形 ) 。 

* rectangle GBJÉ ) , 

* text( 文 本 ) 。 

* window( 组 件 ) 。 

HB 5% E 6 DE IDE .多边 形 和 和 宅 形 这 些 * 封 财 式 ”图形 都 是 由 轮廓 线 和 十 充 颜 色 组 
成 的 ,通过 outline 和 fill 选项 设置 它们 的 颜色 ,还 可 以 设置 为 透明 (传人 空 字符 串 表 示 透 明 ) 。 


2. 坐标 系 


由 于 画布 可 能 比 窗口 大 ( 带 有 滚动 条 的 Canvas 组 件 ) ,因此 Canvas 组 件 可 以 选择 使 用 两 
种 坐标 系 : 

。 窗 口 坐标 系 一 一 以 窗口 的 左上 角 作 为 坐标 原点 。 

。 男 布 坐标 系 一 一 以 画布 的 左上 角 作 为 坐标 原点 。 

3. 画布 对 象 显 示 的 顺序 

Canvas 组 件 中 创建 的 画布 对 象 都 会 被 列 人 显示 列表 中 , 越 接近 背景 的 画布 对 象 位 于 显示 
列表 的 越 下 方 。 显 示 列 表决 定 当 两 个 画布 对 象 重 著 的 时 候 是 如 何 覆 盖 的 (默认 情况 下 新 创建 
的 会 覆盖 旧 的 画布 对 象 的 重 秋 部 分 ,即位 于 显示 列表 上 方 的 画布 对 象 将 覆盖 下 方 那个 )。 当 
然 , 显 示 列 表 中 的 画布 对 象 可 以 被 重新 排序 。 


4. 指定 画布 对 象 
Canvas 组 件 提 供 几 种 方法 可 以 指定 画布 对 象 : 
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* [tem handles, 

* Tags, 

* ALL, 

e CURRENT, 

Item handles 事实 上 是 一 个 用 于 指定 某 个 画布 对 象 的 整 型 数字 (也 称 为 画布 对 象 的 ID) 。 
当 你 在 Canvas 组 件 上 创建 一 个 画布 对 象 的 时 候 ,Tkinter 将 自动 为 其 指定 一 个 在 该 Canvas 组 
件 中 独一无二 的 整 型 值 ,然后 各 种 Canvas 的 方法 可 以 通过 这 个 值 操 纵 该 画布 对 象 。 

Tags 是 附 在 画布 对 象 上 的 标签 ,Tags 由 普通 的 非 空白 字符 串 组 成 。 一 个 画布 对 象 可 以 
与 多 个 Tags 相关 联 .— Tags 也 可 用 于 描述 多 个 画布 对 象 。 然 而 ,与 Text 组 件 不 同 ,没有 
指定 画布 对 象 的 Tags 不 能 进行 事件 绑 定 和 配置 样式 。 也 就 是 说 ,Canvas 组 件 的 Tags 是 仅 为 
画布 对 象 所 拥有 。 

Canvas 组 件 预 定义 了 两 个 Tags: ALL fl CURRENT, 

。 ALL( 或 all) 表 示 Canvas 组 件 中 的 所 有 画布 对 象 。 

e CURRENT( 或 current) 表 示 鼠 标 指针 下 的 画布 对 象 (如 果 有 的 话 ) 。 


45.13 Menu 组 件 


几乎 每 个 应 用 程序 都 可 以 看 到 菜单 ,而 常见 的 菜单 有 “文件 ” “编辑 ”“ 帮 助 ”， 打开 * xí ' 
之 后 , 它 会 下 拉 出 在 干菜 单项 ,例如 “新建 "“ “打开 ”保存 ”“ 退 出 ?等 ,如 图 15-62 所 示 。 


刷新 建文 本 文档 .txt - 记事 本 
SUHA SE) 格式 (D) EAV) 帮助 (H) 


图 15-62 Menu 组 件 ( 一 ) 


Tkinter 提供 了 一 个 Menu 组 件 ,用 于 实现 顶级 菜单 .下拉 菜单 和 弹出 菜单 。 由 于 该 组 件 
是 底层 代码 实现 和 优化 ,所 以 不 建议 你 自行 通过 按钮 和 其 他 组 件 来 实现 菜单 功能 。 

创建 一 个 顶级 菜单 ,需要 先 创 建 一 个 菜单 实例 ,然后 使 用 add() 方 法 将 命令 和 其 他 子 菜 单 
添加 进去 ， 


# pl5 38.py 
from tkinter import * 


root = Tk() 
def callback(): 
print(" 一 被 调用 了 一 ") 


# 创建 一 个 顶级 菜单 


menubar = Menu(root) 
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menubar. add command( label = "Hello", command = callback) 
menubar. add command(label = "Quit", command = root. quit) 


# 显示 菜单 


root. config(menu = menubar) 


mainloop() 


程序 实现 如 图 15-63 所 示 。 
创建 一 个 下 拉 菜 单 ( 或 者 其 他 子 菜单 ), 方 法 也 是 大 同 小 异 , 最 主要 的 区 别 是 它们 最 后 需要 
添加 到 主 菜单 上 (而 不 是 窗口 上 ): 


# pl5 39.py 
from tkinter import * 


root - Tk() 


def callback(): 
print(" 一 被 调用 了 一 ") 


# 创建 一 个 顶级 菜单 

menubar = Menu(root) 

# 创建 一 个 下 拉 菜 单 " 文 件 ", 然 后 将 它 添加 到 顶级 菜单 中 
filemenu = Menu(menubar, tearoff = False) 

filemenu. add command(label = "打开 ", command = callback) 
filemenu. add command(label = "保存 "，command = callback) 
filemenu. add separator() 

filemenu. add command(label = "jB iH", command = root. quit) 
menubar. add cascade(label- "文件 ", menu = filemenu) 

# 创建 另 一 个 下 拉 菜 单 " 编 辑 ", 然 后 将 它 添 加 到 顶级 菜单 中 
editmenu = Menu(menubar, tearoff = False) 

editmenu. add command(label = "$ý HJ", command = callback) 
editmenu. add command(label = "## JI", command = callback) 
editmenu. add command(label = "粘贴 "”，command = callback) 
menubar. add cascade(label- "编辑 ", menu = editmenu) 

# 显示 菜单 


root. config(menu = menubar) 


mainloop() 


程序 实现 如 图 15-64 所 示 。 


fı -ES 


Hello Quit 


15-63 Menu 组 件 ( 二 ) 15-64 Menu 组件 (三 ) 
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创建 一 个 弹出 菜单 方法 也 是 一 致 的 ,不 过 需要 使 用 post() 方 法 明确 地 将 其 显示 出 来 


# pl5 40.py 
from tkinter import * 


root - Tk() 


def callback(): 
print(" 一 被 调用 了 一 ”) 


# 创建 一 个 弹出 菜单 

menu = Menu(root, tearoff = False) 

menu. add command(label = "jfi", command = callback) 
menu. add command(label = "$Œ M", command = callback) 
frame = Frame(root, width= 512, height = 512) 
frame. pack( ) 


def popup( event) : 
menu.post(event.x root, event.y root) 


# 绑 定 鼠标 右键 
frame.bind("« Button - 3 >", popup) 


mainloop() 


大 家 发 现在 创建 一 个 Menu 组 件 的 时 候 都 把 一 个 叫 cearoff 的 选项 设置 为 False。 那 么 这 
个 翻译 为 “所 开 ”的 选项 有 什么 用 呢 ? Tkinter 要 我 们 撕 开 什么 呢 ?” 好 了 ,大 家 不 要 想 焉 了 , 试 
试 便 知 一 一 把 tearoff 改 为 True 之后,“ 文件” 菜单 增 加 了 一 行 小 模 杠 ,如 图 15-65 所 示 。 

单 击 一 下 , 噢 ,原来 Tkinter 让 我 们 打开 的 是 菜单 ,如 图 15-66 所 示 。 


文件 编辑 
Xe ES 
打开 
保存 
退出 
图 15-65 Menu 组 件 ( 四 ) 图 15-66 Menu 组 件 (五 ) 


最 后 ,这 个 菜单 不 仅 可 以 添加 常见 的 命令 菜单 项 ,还 可 以 添加 单 选 按 钮 或 多 选 按 钮 ,那么 
用 法 就 跟 Checkbutton 组 件 和 Radiobutton 组 件 类 似 啦 。 


# pl5 41.py 
from tkinter import * 


root - Tk() 
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def callback(): 
print(" 一 被 调用 了 一 ") 


# 创建 一 个 顶级 菜单 

menubar = Menu(root) 

# 创建 checkbutton 关联 变量 

openVar = IntVar() 

saveVar = IntVar() 

exitVar - IntVar() 

# 创建 一 个 下 拉 菜 单 " 文 件 ", 然 后 将 它 添加 到 顶级 菜单 中 
filemenu = Menu(menubar, tearoff = True) 

filemenu. add checkbutton(label- "jTJf", command = callback, variable = openVar) 
filemenu. add checkbutton(label = "保存 "，command = callback, variable = saveVar) 
filemenu. add separator() 

filemenu. add checkbutton(label = "iR iH", command = root. quit, variable = exitVar) 
menubar. add cascade( label = "TX f/f", menu = filemenu) 

# 创建 radiobutton 关联 变量 

editVar = IntVar() 

editVar. set(1) 

# 创建 另 一 个 下 拉 菜 单 " 编 辑 ", 然 后 将 它 添 加 到 顶级 菜单 中 

editmenu = Menu(menubar, tearoff = True) 

editmenu. add radiobutton (label = " 89 HJ", command = callback, 
variable = editVar, value= 1) 

editmenu. add radiobutton (label = "j£ ll", command = callback, 
variable = editVar, value= 2) 

editmenu. add radiobutton (label = " fj Mf", command = callback, 
variable = editVar, value= 3) 

menubar. add cascade(label- "编辑 "，menu = editmenu) 

# 显示 菜单 


root. config(menu = menubar) 


mainloop() 


程序 实现 如 图 15-67 所 示 。 


15-67 Menu 组 件 ( 六 ) 


15. 14 Menubutton 组 件 
as" 


Menubutton 组 件 是 一 个 与 Menu 组 件 相 关联 的 按钮 , 它 可 以 放 在 窗口 中 的 任意 位 置 ,并 
且 在 被 按 下 时 弹出 下 拉 菜 单 。 这 个 组 件 是 有 一 定 的 历史 意义 的 ,在 Tkinter 的 早期 版 本 ,使 用 
Menubutton 组 件 来 实现 顶级 菜单 ,但 现在 直接 用 Menu 组 件 就 可 以 实现 了 。 因 此 ,现在 该 组 
件 适用 于 你 希望 菜单 按钮 出 现在 其 他 位 置 的 时 候 。 

创建 一 个 Menubutton 组 件 ,并 创建 一 个 Menu 组 件 与 之 相关 联 : 


# pl5 42.py 
from tkinter import * 


root - Tk() 
def callback(): 


print(" 一 被 调用 了 一 ”) 
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mb = Menubutton(root, text = "Zi d£", relief = RAISED) 

mb. pack( ) 

filemenu - Menu(mb, tearoff - False) 

filemenu. add checkbutton(label- "打开 ", command = callback, selectcolor = "yellow") 
filemenu. add command(label = "{} ff", command = callback) 

filemenu. add separator() 

filemenu. add command(label = "iR iH", command = root. quit) 

mb.config(menu = filemenu) 


mainloop() 


程序 实现 如 图 15-68 所 示 。 


图 15-68 Menubutton £f fF 


115.15 OptionMenu £8 ft 
us" 


OptionMenu( 选 项 菜单 ) 事 实 上 是 下 拉 菜 单 的 改版 , 它 的 发 明 弥 补 了 Listbox 组 件 无 法 实 
现下 拉 列 表 框 的 遗憾 。 创 建 一 个 选择 菜单 非常 简单 ,只 需要 它 一 个 Tkinter 变量 (用 于 记录 用 
户 选 择 了 什么 ) 以 及 硅 干 选项 即 可 : 


# pl5 43.py 
from tkinter import * 


root - Tk() 

variable - StringVar() 

variable. set("one") 

w = OptionMenu(root, variable, "one", "two", "three") 
w. pack( ) 


mainloop() 


程序 实现 如 图 15-69 所 示 。 
要 获得 用 户 选择 的 内 容 , 使 用 Tkinter 变量 的 get() 方 法 即 可 : 


def callback(): 
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print(variable.get()) 


Button(root, text = "ji dE", command = callback). pack() 


修改 后 程序 实现 如 图 15-70 所 示 。 


图 15-69 OptionMenu 组 件 ( 一 ) 15-70 OptionMenu 组 件 ( 二 ) 


最 后 演示 如 何 将 很 多 选项 添加 到 选项 菜单 中 : 


# pl5 44.py 
from tkinter import * 


OPTIONS - [ 

"California", 

"458", 

"FF", 

"ENZO", 

"LaFerrari" 

] California —4 
root = Tk() 
variable = StringVar() California 
variable. set(OPTIONS[0]) 458 
w = OptionMenu(root, variable, * OPTIONS) FF 
w. pack( ) ENZO 


LaFerrari 


def callback(): 
print(variable.get()) 


Button(root, text = "ji j£", command = callback). pack() 


mainloop() 


程序 实现 如 图 15-71 所 示 。 


15.1 6 Message 组 件 


图 15-71 OnbptionMenu 组 件 ( 三 ) 


动 换 行 ,并 调整 文本 的 尺寸 使 其 适应 给 定 的 尺寸 。 
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# p15_45. py 
from tkinter import * 


root - Tk() 

wl = Message(root, text = "这 是 一 则 消息 "，width = 100) f tk ie OX 
w1.pack() 这 是 一 则 消息 

w2 = Message(root, text = "这 是 一 则 骇人听闻 的 长 长 Mp 

长 长 长 消息 !"，width= 100) 听闻 的 长 长 长 

w2. pack( ) 长 长 消息 ! 

mainloop() 


程序 实现 如 图 15-72 所 示 , 图 15-72 Message fH ff 


45. 17 Spinbox 组 件 
as 


Spinbox £H fF CTk8. 4 新 增 ) 是 Entry 组 件 的 变 体 ,用 于 从 一 些 固定 的 值 中 选取 一 个 。 
Spinbox 组 件 跟 Entry 组 件 用 法 非常 相似 ,主要 区 别 是 使 用 Spinbox 组 件 , 可 以 通过 范围 或 者 
元 组 指定 允许 用 户 输入 的 内 容 。 


# p15_46. py 
from tkinter import * 


root = Tk() 
w = Spinbox(root, from_= 0, to= 10) 


w. pack( ) 


mainloop() 


程序 实现 如 图 15-73 所 示 。 
还 可 以 通过 元 组 指定 允许 输入 的 值 : 


w = Spinbox(root，values = (" 小 甲鱼 "，" 一 风 介 一 "，"wei Y", "E&^EST")) 


程序 修改 后 实现 如 图 15-74 所 示 。 


AXE E 王 本 汗 


0 $ 小 甲鱼 $ 
15-73 Spinbox 组 件 ( 一 ) 图 15-74 Spinbox 组 件 ( 二 ) 


15. 18  PanedWindow 组 件 
-2 


PanedWindow 组 件 (Tk8.4 新 增 ) 是 一 个 空间 管理 组 件 。 跟 Frame 组 件 类 似 , 都 是 为 组 
件 提 供 一 个 框架 ,不 过 PanedWindow 人 允许 让 用 户 调 整 应 用 程序 的 空间 划分 。 
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创建 一 个 两 窗 格 的 PanedWindow 组 件 非 常 简单 : 


# pl5 47. py 
from tkinter import * 


m = PanedWindow(orient = VERTICAL) 
m.pack(fill = BOTH, expand- 1) 

top = Label(m, text - "top pane") 

m. add( top) 

bottom = Label(m, text = "bottom pane") 
m. add( bottom) 


mainloop() 


程序 实现 如 图 15-75 所 示 。 


这 条 线 你 看 不 到 ， 但 并 不 代表 不 存在 。 
何不 尝试 用 手 去 触摸 一 下 ? 


图 15-75 PanedWindow 组 件 (一 ) 
创建 一 个 三 窗 格 的 PanedWindow 组 件 则 需要 一 点 小 技巧 : 


# pl5 48.py 
from tkinter import * 


ml = PanedWindow() 

ml.pack(fill = BOTH, expand- 1) 

left = Label(ml, text = "left pane") 
m1.add(left) 

m2 - PanedWindow(orient - VERTICAL) 
m1.add(m2) 

top = Label(m2, text = "top pane") 

m2. add( top) 

bottom = Label(m2, text = "bottom pane") 
m2. add( bottom) 


mainloop() 


程序 实现 如 图 15-76 所 示 。 

这 里 不 同窗 格 事实 上 是 有 一 条 “分 割 线 ”(sash) 隔 开 ,虽然 你 看 不 到 ,但 你 却 可 以 感受 到 它 
的 存在 。 不 妨 把 鼠标 缓慢 移动 到 大 概 的 位 置 , 当 鼠 标 指 针 改 变 的 时 候 后 拖 动 鼠 标 …… 也 可 以 
把 “分 割 线 > 显 式 地 显示 出 来 ,并 且 可 以 为 它 附 上 一 个 “手柄 ”(handle) : 


# pl5 49.py 
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left Pa NI 
bottom pane 


这 两 条 线 你 看 不 到 ， 但 并 不 代表 不 存在 。 
何不 尝试 用 手 去 触摸 一 下 ? 


15-76 PanedWindow 组 件 ( 二 ) 


from tkinter import 关 


m1 - PanedWindow(showhandle - True, sashrelief - SUNKEN) 

m1.pack(fill- BOTH, expand- 1) 

left = Label(ml, text = "left pane") 

m1.add(left) 

m2 = PanedWindow(orient = VERTICAL, showhandle = True, sashrelief = SUNKEN) 
m1.add(m2) 

top = Label(m2, text = "top pane") 

m2. add(top) 

bottom - Label(m2, text - "bottom pane") 

m2. add(bottom) 


mainloop() 


程序 实现 如 图 15-77 所 示 。 


L| tk ==] 
7 top pane 
- - 
left pane 
bottom pane 


图 15-77  PanedWindow 组 件 ( 三 ) 


(15.19 Toplevel 组 件 
a" 


Toplevel( 顶 级 窗口 ) 组 件 类 似 于 Frame 组件, 但 Toplevel 组 件 是 一 个 独立 的 顶级 窗口 ， 
这 种 窗口 通常 拥有 标题 栏 边框 等 部 件 。Toplevel 组 件 通 常用 在 显示 额外 的 窗口 、 对 话 框 和 其 
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他 弹出 窗口 中 。 
在 下 面 的 例子 中 ,在 root 窗口 添加 一 个 按钮 用 于 创建 一 个 顶级 窗口 ,点 一 下 出 现 一 个 : 


# p15_50. py 
from tkinter import * 


root = Tk() 


def create(): 
top = Toplevel() 
top. title("FishC Demo") 
msg = Message(top, text = "I love FishC. com") 


msg. pack( ) 
Button(root, text = "创建 顶级 窗口 "，command = create). pack() 


mainloop() 
程序 实现 如 图 15-78 所 示 。 


f tk - OES 


创建 顶级 窗口 


TE] E 


Ilove 
FishC.com! 


15-78  Toplevel 组 件 ( 一 ) 


想 要 几 个 就 点 几 下 ,如 图 15-79 所 示 。 


(''- og 
Ilove 


FishC.com! 
n- OES T m- OES 


l love I love 
FishC.com! fF- = | 5x] FishC.com! 


I love 
FishC.com! 


15-79  Toplevel £8 fF ( C) 


最 后 ,Tkinter 提供 这 一 系列 方法 用 于 与 窗口 管理 器 进行 交互 。 它 们 可 以 被 Tk( 根 窗口 ) 
进行 调用 ,同样 也 适用 于 Toplevel( 顶 级 窗口 )。 详 情 请 查看 http://bbs. fishc. com/thread- 
61246-1-1. html, 
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这 里 有 必要 讲 一 下 的 是 attributesO 这 个 方法 , 它 用 于 设置 和 获取 窗口 属性 ,如 果 只 给 出 
选项 名 ,将 返回 当前 窗口 该 选项 的 值 。 注 意 : 以 下 选项 不 支持 关键 字 参 数 ,需要 在 选项 前 添加 


横 杠 (-) 并 用 字符 串 的 方式 表示 ,用 逗号 (,) 隅 开 选 项 和 值 。 
下 面 演示 将 Toplevel 的 窗口 设置 为 50% 和 透明: 


# pl5 51. py 
from tkinter import * 


root - Tk() 


def create(): 
top = Toplevel() 
top. title("FishC Demo") 
top.attributes(" - alpha", 0.5) 
msg - Message(top, text - "I love FishC. com") 
msg. pack( ) 


Button(root, text = "创建 顶级 窗口 "，command = create). pack() 


mainloop() 


程序 实现 如 图 15-80 所 示 。 


5.20 事件 绑 定 


nz 由 
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| Ilove BR SE 口 
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图 15-80  Toplevel 组 件 ( 三 ) 


一 个 Tkinter 应 用 程序 大 部 分 时 间 花 费 在 事件 循环 中 (通过 mainloop() 方 法 进入 ) 。 事 件 
可 以 有 各 种 来 源 , 包 括 用 户 触发 的 鼠标 、 键 盘 操作 和 窗口 管理 需 触 发 的 重 绘 事件 (在 多 数 情况 


下 是 由 用 户 间 接 引 起 的 ) 。 


Tkinter 提供 一 个 强大 的 机 制 可 以 让 你 日 由 地 处 理事 件 ,对 于 每 个 组 件 来 说 ,可 以 通过 
bind() 方 法 将 果 数 或 方法 绑 定 到 具体 的 事件 上 。 当 被 触发 的 事件 满足 该 组 件 绑 定 的 事件 时 ， 


Tkinter 就 会 市 着 事件 描述 去 调用 handler() 方 法 。 
下 面 有 几 个 例子 ,请 随意 感受 下 : 
# pl5 45.py 


# 捕获 单 击 鼠 标的 位 置 


from tkinter import * 
root - Tk() 


def callback(event): 
print(" 点 击 位 置 : ", event.x, event. y) 


frame = Frame(root, width- 200, height = 200) 
frame.bind("« Button- 1»", callback) 


frame. pack( ) 


mainloop() 
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tt 一 


: 5030 
: 67 56 
: 10194 
. /4 128 


: 28 156 
. 116 178 
: 158 189 
: 97 184 


图 15-81 事件 绑 定 (一 ) 


在 上 面 这 个 例子 中 ,使 用 Frame 组 件 的 bind() 方 法 将 鼠标 单 击 事件 (过 Button-1 二 ) 和 自 
定义 的 callback() 方 法 绑 定 起 来 。 那 么 运行 后 的 结果 是 一 一 当 你 单 击 鼠标 左 键 的 时 候 ,IDLE 
会 相应 地 将 鼠标 的 位 置 显示 出 来 。 

只 有 当 组 件 获得 焦点 的 时 候 才 能 接收 键盘 事件 (Key) ,下 面 的 例子 中 用 focus_set() 获 得 
焦点 ,你 可 以 设置 Frame 的 takefocus 选项 为 True, 然 后 使 用 Tab 将 焦点 转移 上 来 。 

# pl5 46.py 

# 捕获 键盘 事件 


from tkinter import * 
root - Tk() 


def callback(event): 
print(" Ei [V E: ", repr(event. char) ) 


frame = Frame(root, width- 200, height = 200) 
frame. bind("< Key»", callback) 


frame.focus set() 
frame. pack( ) 


mainloop() 


程序 实现 如 图 15-82 所 示 。 
最 后 一 个 例子 展示 捕获 鼠标 在 组 件 上 的 运动 轨迹 ,这 里 需要 关注 的 是 二 Motion 二 事件 . 


# pl5 47.py 
from tkinter import * 


root - Tk() 


def callback(event): 
print(" 当 前 位 置 : ", event. x, event. y) 


frame = Frame(root, width= 200, height = 200) 
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图 15-82 ”事件 绑 定 (二 ) 


frame.bind("« Motion»", callback) 
frame. pack( ) 


mainloop() 


5.21 事件 序列 


mA 

Tkinter 使 用 一 种 称 为 事件 序列 的 机 制 来 允许 用 户 定 义 事件 ,用 户 需 使 用 bind OZr i£ f 
具体 的 事件 序列 与 上 自 定义 的 方法 绑 定 。 事 件 序列 是 以 字符 串 的 形式 表示 的 ,可 以 表示 一 个 或 
多 个 相关 联 的 事件 (如 果 是 多 个 事件 ,那么 对 应 的 方法 只 有 在 满足 所 有 事件 的 前 提 下 才 会 被 
调用 ) 。 

事件 序列 使 用 以 下 语法 描述 : 


1 


^ 


< modifier - type - detail > 

。 OR HTIE PIE B1 ERHI C... 0B. 

* type 部 分 的 内 容 是 最 重要 的 , 它 通常 用 于 描述 普通 的 事件 类 型 ,例如 鼠标 单 击 或 键盘 
按键 单 击 ( 详 见 表 15-5)。 

modifier 部 分 的 内 容 是 可 选 的 , 它 通常 用 于 描述 组 合 键 ,例如 Ctrl 十 C、Shift 十 鼠标 左 
键 单 击 ( 详 见 表 15-6) 。 

detail 部 分 的 内 容 是 可 选 的 , 它 通常 用 于 描述 具体 的 按键 ,例如 Button-l 表示 鼠标 左 
键 。 比 如 : 

(1) <Button-1 > 7n H P Aih MER Ze f 

(2) —KeyPress-H— Xn HP TE F H 键 。 

(3) 一 Control-Shift-KeyPress-H 二 表示 用 户 同 时 按 下 Ctrl 十 Shift 十 了 键 。 


157214.1- type 
X 15-5 列举 了 type 部 分 常用 的 关键 词 及 含义 。 
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type 


Activate 


Button 
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X 15-5 type 部 分 常用 的 关键 词 及 含义 
含 Xx 
当 组 件 的 状态 从 “未 激活 ” 变 为 “激活 ”的 时 候 触 发 该 事件 
当 用 户 单 击 鼠 标 按键 的 时 候 触 发 该 事件 。detail 部 分 指定 具体 哪个 按键 : 二 Button-1 二 鼠 
ERA 5 ,— Button-2 — Bi br P S£ , < Button-3 > BU bro RE, — Button-4— i$ $£ E18 (Linux), 
— Button-5— i8 $£ F i& (Linux) 
当 用 户 释 放 鼠 标 按键 的 时 候 触 发 该 事件 。 在 大 多 数 情 况 下 , 比 Button 要 更 好 用 ,因为 如 果 


ButtonRelease 


Configure 
Deactivate 
Destroy 
Enter 


Expose 
FocusIn 
FocusOut 
KeyPress 


KeyRelease 


Leave 
Map 


Motion 


当 用 户 不 小 心 按 下 鼠标 ,用户 可 以 将 鼠标 移出 组 件 再 释放 鼠标 ,从 而 避免 不 小 心 触发 事件 
当 组 件 的 尺寸 发 生 改 变 的 时 候 触 发 该 事件 

当 组 件 的 状态 从 “激活 ” 变 为 “未 激活 ”的 时 候 触 发 该 事件 

当 组 件 被 销毁 的 时 候 触 发 该 事件 

当 鼠 标 指 针 进 入 组 件 的 时 候 触 发 该 事件 。 注 意 : 不 是 指 用 户 按 下 回 车 键 

当 窗 口 或 组 件 的 某 部 分 不 再 被 覆盖 的 时 候 触 发 该 事件 

当 组 件 获 得 焦点 的 时 候 触 发 该 事件 。 用 户 可 以 用 Tab 键 将 焦点 转移 到 该 组 件 上 (需要 该 组 
件 的 takefocus 选项 为 True) ,也 可 以 调用 focus_set() 方 法 使 该 组 件 获 得 焦点 

当 组 件 失 去 焦点 的 时 候 触 发 该 事件 

当 用 户 按 下 键盘 按键 的 时 候 触 发 该 事件 。detail 可 以 指定 具体 的 按键 ,例如 二 KeyPress-H 二 
表示 当 大 写字 母 H 被 按 下 的 时 候 触 发 该 事件 。KeyPress 可 以 简写 为 Key 

当 用 户 释放 键盘 按键 的 时 候 触 发 该 事件 

当 鼠 标 指针 离开 组 件 的 时 候 触 发 该 事件 

当 组 件 被 映射 的 时 候 触发 该 事件 。 意 思 是 在 应 用 程序 中 显示 该 组 件 的 时 候 , 例 如 ,调用 
grid() 方 法 

当 鼠 标 在 组 件 内 移动 的 整个 过 程 均 触 发 该 事件 

当 鼠 标 滚 轮 滚 动 的 时 候 触 发 该 事件 。 目 前 该 事件 仅 支 持 Windows 和 Mac 系统 ,Linux 系统 


MouseWheel 


Unmap 


Visibility 


请 参考 Button 

当 组 件 被 取消 映射 的 时 候 触 发 该 事件 。 意 思 是 在 应 用 程序 中 不 再 显示 该 组 件 的 时 候 , 例 如 
调用 grid_remove() 方 法 

当 应 用 程序 至 少 有 一 部 分 在 屏幕 中 是 可 见 的 时 候 触发 该 事件 


15.21.2 modifier 


K 15-6 列举 了 modifier 部 分 常用 的 关键 词 及 含义 。 


modifier 
Alt 


Any 
Control 


Double 


表 15-6 modifier 部 分 常用 的 关键 词 及 含义 
含 X 
当 按 下 Alt 按键 的 时 候 
表示 任何 类 型 的 按键 被 按 下 的 时 候 。 例 如 ,二 Any-KeyPress 二 表示 当 用 户 按 下 任何 按键 时 触 
发 事件 
当 按 下 Ctrl 按键 的 时 候 
当 后 续 两 个 事件 被 连续 触发 的 时 候 。 例 如 二 Double-Button-1 二 表示 当 用 户 双 击 鼠 标 左 键 时 触 
发 事件 
当 打 开 大 写字 母 锁 定 键 (CapsLock) 的 时 候 
当 按 下 Shift 按键 的 时 候 
ER Double 类 似 , 当 后 续 三 个 事件 被 连续 触发 的 时 候 
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T 


415.22 Event X% 
mt 


M Tkinter 去 回调 预先 定义 的 函数 时 ,将 带 着 Event 对 象 ( 作 为 参数 ) 去 调用 , 表 15-7 列举 
了 Event 对 象 的 属性 及 含义 。 
表 15-7 Event 对 象 的 属性 及 含义 


属 性 含 xX 
widget 产生 该 事件 的 组 件 
X» y 当前 的 鼠标 位 置 坐标 (相对 于 窗口 左上 角 ,像素 为 单位 ) 
X root. y root 当前 的 鼠标 位 置 坐标 (相对 于 屏幕 左上 和 角 ,像素 为 单位 ) 
char 按键 对 应 的 字符 (键盘 事件 专属 ) 
keysym 按键 名 , 见 下 方 Key names (键盘 事件 专属 ) 
keycode 按键 码 , 见 下 方 Key names( 键 盘 事 件 专 属 ) 
num 按钮 数字 (鼠标 事件 专属 ) 
width, height 组 件 的 新 尺寸 (Configure 事件 专属 ) 
type 该 事件 类 型 


当 事 件 为 二 Key 二 、 一 KeyPress 二 、 — KeyRelease- fJ HT] fi , detail 可 以 通过 设 定 具体 的 按 
BEA (keysym)2E pe, f Ul-—Key-Ho KR tk TER EIAS -EBEH 时 候 触发 事件 ,一 Key- 
Tab 之 表示 按 下 键盘 上 的 Tab 按键 的 时 候 触 发 事件 。 

K 15-8 列举 了 键盘 所 有 特殊 按键 的 keysym 和 keycode( 其 中 的 按键 码 是 对 应 美国 标准 
101 键盘 的 Latin-l 字符 集 ,键盘 标准 不 同 对 应 的 按键 码 不 同 , 但 按键 名 是 一 样 的 ) 。 


表 15-8 键盘 所 有 特殊 按键 的 keysym 和 keycode 


按键 名 (keysym) 代表 的 按键 
Alt_L 4 左边 的 Alt 按键 
Alt_R 113 右边 的 Alc 按键 
BackSpace Backspace( 退 格 ) 按 键 
Cancel break 按键 
Caps_Lock 站 CapsLock( 大 写字 母 锁定 ) 按 键 
Control L 左边 的 Ctrl 按键 
Control R 109 右边 的 Ctrl 按键 
Delete Deler Ri 

m II 

End 103 End 按键 

Execute 111 SysReq 按键 

n IET 

F3 O 089 | F3 按键 

" III. 
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按键 名 (keysym) 


F7 

F8 

F9 

F10 

F11 

F12 

Home 
Insert 

Left 
Linefeed 
KP 0 
KP 1 
KP 2 
KP 3 
KP 4 
KP 5 
KP 6 
KP 7 
KP 8 
KP 9 

KP Add 
KP Begin 
KP Decimal 
KP Delete 
KP Divide 
KP Down 
KP End 
KP Enter 
KP Home 
KP Insert 
KP Left 
KP Multiply 
KP Next 
KP Prior 
KP Right 
KP Subtract 
KP Up 
Next 

Num Lock 
Pause 


Print 


按键 码 (keycode) 


Te) 23 e | eR | | ed 
- End Ed ELE Ead bc: 


I| /一 
oO|o 
OID 


oo | oo «to "Ap Uc * 
~] | co = | = — ojan e add bn > 


oo | oo 


Oo 


— 
c | 一 
eo (S) 


Oo c» | oo e. 
e | =e edil Bos * 


oo 


bs 
© 
c1 


一 | ejN 
e | 一 | ~ 了] 
一 | 一 


代表 的 按键 


F7 按键 

F8 按键 

F9 按键 

F10 按键 

F11 按键 

F12 按键 

Home 按键 

Insert 按键 

< 按键 
Linefeed(CCtrl + J) 
小 键盘 数字 0 

小 键盘 数字 1 

小 键盘 数字 2 

小 键盘 数字 3 

小 键盘 数字 4 

小 键盘 数字 5 

小 键盘 数字 6 

小 键盘 数字 7 

小 键盘 数字 8 

小 键盘 数字 9 

小 键盘 的 十 按键 

小 键盘 的 中 间 按 键 (5) 
小 键盘 的 点 按键 (. ) 
小 键盘 的 删除 键 

小 键盘 的 /按键 

小 键盘 的 y 按键 
小 键盘 的 End 按键 
小 键盘 的 Enter 按键 
小 键盘 的 Home 按键 
小 键盘 的 Insert 按键 
小 键盘 的 一 按键 

小 键盘 的 * 按键 


小 键盘 的 PageDown 按键 


小 键盘 的 PageUp 按键 
小 键盘 的 一 按键 

小 键盘 的 -按键 

小 键盘 的 个 按键 
PageDown 按键 


NumLock( 数 字 锁 定 ) 按 键 


Pause( 和 暂停) 按键 


PrintScrn( 打 印 屏幕 ) 按 键 
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续 表 

按键 名 (keysym) 代表 的 按键 

Prior DEBER PageUp 按键 

Return Enter( 回 车 ) 按 键 

Right 102 一 按键 

Scroll Lock ScrollLock 按键 

Shift L 左边 的 Shift 按键 

Shift R DECR 右边 的 Shift 按键 

Tab Tab( 制 表 ) 按 键 

Up O 98 | + 按键 


45.23 布局 管理 器 


什么 是 布局 管理 天 ? 说 日 了 就 是 管理 你 的 那些 组 件 如 何 排 列 的 家 伙 。Tkinter 有 三 个 布 
局 管理 需 ,分 别 是 pack, grid 和 place, 其 中 : 

* pack Je f ds JI M JF HESI 2H fF o 

* grid 是 按 行 / 列 形式 排列 组 件 。 

* place 允许 程序 员 指 定 组 件 的 大 小 和 位 置 。 


$23. 1-- pack 


pack 其 实 之 前 的 例子 一 直 在 用 ,对 比 grid 4$ 3E a8. pack. 更 适用 于 少量 组 件 的 排列 ,但 它 
在 使 用 上 更 加 简单 。 如 果 需 要 创建 相对 复杂 的 布局 结构 ,那么 建议 是 使 用 多 个 框架 (Frame) 
结构 ,或 者 使 用 grid 4$ FE gs 3: JL, 


“十 
` 


不 要 在 同一 个 父 组 件 中 混合 使 用 pack 和 grid, B A Tkinter 会 很 认真 地 在 那儿 计算 


到 底 先 使 用 哪个 布局 管理 器 …… 以 至 于 你 等 了 半 个 小 时 ,Tkinter 还 在 那儿 纠结 不 出 结果 ! 


我 们 篆 篆 会 遇 到 的 一 个 情况 是 将 一 个 组 件 放 到 一 个 容 需 组 件 中 ,并 填充 整个 父 组 件 。 下 
面 生 成 一 个 Listbox 组 件 并 将 它 填 充 到 root 窗口 中 : 


# pl5 55.py 
from tkinter import * 


root - Tk() 
listbox = Listbox(root) 
listbox. pack(fill - BOTH, expand - True) 
for i in range(10): 
listbox. insert(END, str(i)) 


mainloop() 
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程序 实现 如 图 15-83 所 示 。 

其 中 ,fil 选项 是 告诉 窗口 管理 需 该 组 件 将 填充 整个 分 配给 它 的 空间 ,BOTH 表示 同时 横 
向 和 纵向 扩展 ,X 表示 横向 ,Y 表示 纵向 ; expand 选项 是 告诉 窗口 管理 器 将 父 组 件 的 额外 空间 
也 填 满 。 

默认 情况 下 ,pack 是 将 添加 的 组 件 依 次 纵向 排列 : 


#9 pl5 56.py 
from tkinter import * 


root = Tk() 

Label(root, text = "Red", bg= "red", fg= "white").pack(fill- X) 
Label(root, text = "Green", bg = "green", fg= "black").pack(fill- X) 
Label(root, text = "Blue", bg = "blue", fg= "white").pack(fill- X) 


mainloop() 


程序 实现 如 图 15-84 所 示 。 
如 果 想 要 组 件 横向 挨个 儿 排列 ,可 以 使 用 side 选项 : 


Label(root, text = "Red", bg= "red", fg= "white").pack(side= LEFT) 
Label(root, text = "Green", bg- "green", fg= "black").pack(side = LEFT) 
Label(root, text = "Blue", bg = "blue", fg- "white" ). pack(side = LEFT) 


程序 修改 后 ,实现 如 图 15-85 所 示 ，。 
Fé tk - ES 


图 15-83 pack 管理 器 图 15-84 纵向 排列 图 15-85 横向 排列 


se grid 


grid 管理 如 可 以 说 是 Tkinter 这 三 个 布局 管理 需 中 最 灵活 多 变 的 。 当 你 在 设计 对 话 框 的 
时 候 , 使 用 gird 尤其 便捷 。 如 果 你 此 前 一 直 在 用 pack 构造 窗口 布局 ,那么 学 习 完 grid 你 会 
恨 当 初 为 喻 不 早 学 它 。 使 用 一 个 grid 就 可 以 简单 地 实现 你 用 很 多 个 框架 和 pack 搭建 起 来 的 
效果 。 

使 用 grid 排列 组 件 , 只 需 告 诉 它 你 想 要 将 组 件 放 置 的 位 置 ( 行 / 列 ,row 选项 指定 行 ， 
cloumn 选项 指定 列 )。 此 外 ,你 并 不 用 提前 指出 网 格 (grid 分 布 给 组 件 的 位 置 称 为 网 格 ) 的 尺 
才 , 因 为 管理 需 会 和 目 动 计算 。 
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# pl5 57.py 
from tkinter import * 


root - Tk() 

# column 默认 值 是 0 

Label(root, text = "用 户 名 ").grid(row= 0) 
Label(root, text = "密码 ") .grid(row=1) 
Entry(root). grid(row=0，column=1l) 

Entry(root, show =" *").grid(row- 1, column = 1) 


mainloop() 


程序 实现 如 图 15-86 Bros 

默认 情况 下 组 件 会 居中 显示 在 对 应 的 网 格 里 ,你 可 以 使 用 sticky 选项 来 修改 这 一 特性 。 
该 选项 可 以 使 用 的 值 有 E、W、S、N(EWSN 分 别 表示 东西 南北 , 即 上 北 下 南 左 西 右 东 ) 以 及 它 
们 的 组 合 。 因 此 ,可 以 通过 sticky = W 使 得 Label 左 对 齐 : 


Label(root，text = "用 户 名 ").grid(row= 0, sticky - W) 
Label(root, text = "密码 ").grid(row=1, sticky= W) 


程序 修改 后 ,实现 如 图 15-87 所 示 。 


上 MEE 1 k -OES 
用 户 名 小 甲鱼 用 户 名 
一 一 一 一 一 


MEE emere 密码 
图 15-86 grid 管理 器 图 15-87 sticky 选项 修改 对 齐 方式 


有 时 候 可 能 需要 用 几 个 网 格 来 放置 一 个 组 件 , 可 以 做 到 吗 ? 当然 可 以 ,只 需要 指定 
rowspan 和 columnspan 就 可 以 实现 跨行 和 跨 列 的 功能 : 


#9 pl5 58.py 
from tkinter import * 


root = Tk() 
Label(root, text = "用 户 名 ").grid(row= 0, sticky= W) 
Label(root, text = "密码 ").grid(row= 1, sticky= W) 


Entry(root).grid(row= 0, column - 1) 

Entry(root, show- " * ").grid(row- 1, column- 1) 

photo = Photolmage(file = "logo.gif") / tk 一 0 EN 
—— — photo) ah row = 0, column = 2, 用 户 名 mea 

rowspan = 2, padx- 5, pady = 5) 

Button ( text = " 提 AU, width - 10). grid ( IOW = zs 密码 kx 


columnspan = 3, pady = 5) 
ELM 
mainloop() 


程序 实现 如 图 15-88 所 示 。 图 15-88 ”跨行 和 跨 列 布局 
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15.23.3 place 


通常 情况 下 不 建议 使 用 place 布局 管理 需 , 因 为 对 比 起 pack 和 grid. place 要 做 更 多 的 工 
不 过 纯 在 即 合 理 ,place 在 一 些 特殊 的 情况 下 可 以 发 挥 妙 用 。 请 看 下 面 的 例子 。 
使 用 place, 可 以 将 子 组 件 显 示 在 父 组 件 的 正中 间 : 


# pl5 59. py 
from tkinter import * 


root - Tk() 


def callback(): 
print("jE rP 8g 4") 


Button(root, text = "点 我 ", command = callback).place(relx- 0.5, rely 2 0.5, anchor = CENTER) 


mainloop() 


程序 实现 如 图 15-89 所 示 。 
在 某 种 情况 下 ,或 许 你 希望 一 个 组 件 可 以 覆盖 男 一 个 组 件 , 那 么 place 又 可 以 派 上 用 场 
下 面 例子 演示 用 Button % m Label 组 件 : 


# pl5 60. py 
from tkinter import * 


root - Tk() 


def callback(): 
print("jE rp 88 4^") 
photo = Photolmage(file- "logo big.gif") 
Label(root, image = photo). pack() 
Button(root, text = "点 我 ", command = callback).place(relx- 0.5, rely - 0.5, anchor = CENTER) 


mainloop() 


程序 实现 如 图 15-90 所 示 。 


tt 一 o 


图 15-89 place 管理 器 图 15-90 ”利用 place 覆盖 组 件 
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不 难看 出 ,relx 和 rely 选项 指定 的 是 相对 于 父 组 件 的 位 置 , 范 围 是 00 一 1.0, 因 此 0. 5 表 
示 位 于 正中 间 。 那 么 relwidth 和 relheight 选项 则 是 指定 相对 于 父 组 件 的 尺寸 : 


# pl5 61.py 
from tkinter import * 


root = Tk() 

Label(root, bg = " red"). place (relx = 0. 5, rely = 0. 5, f tk. — = XD 
relheight = 0.75, relwidth- 0.75, anchor = CENTER) 
Label(root, bg = " yellow"). place(relx = 0.5, rely = 0. 5, 
relheight = 0.5, relwidth- 0.5, anchor = CENTER) 

Label(root, bg = " green"). place (relx = 0.5, rely = 0. 5, 
relheight = 0.25, relwidth- 0.25, anchor = CENTER) 


mainloop() 


程序 实现 如 图 15-91 所 示 。 
对 于 上 面 的 代码 ,无 论 你 如 何 拉 伸 改变 窗口 ,三 个 Label 
的 尺 才 均 会 跟着 同步 。 


15. 24 标准 对 话 框 


Tkinter 提供 了 三 种 标准 对 话 框 模块 ,分 别 是 : 


* messagebox, 


15-91 相对 位 置 和 相对 尺寸 


* filedialog, 
e colorchooser, 

这 三 个 模块 原来 是 独立 的 ,分 别 是 tkMessageBox,tkFileDialog 和 tkColorChooser. 2; 3 
FAF EEM., Æ Python3 之 后 ,这 些 模块 全 部 被 收 归 到 tkinter 模块 的 府 下 。 下 面 的 所 有 演 
示 都 是 在 Python3 下 实现 的 ,如 果 你 用 的 是 Python2. x. 请 在 文件 处 加 入 import 
tkMessageBox, 然 后 将 messagebox 替换 为 tkMessageBox 即 可 , 


15.24.1 messagebox( 消 息 对 话 框 ) 


表 15-9 列举 使 用 messagebox 可 以 创建 的 所 有 标准 对 话 框 样式 。 
表 15-9 messagebox 创建 的 标准 对 话 框 样式 
使 用 函数 对 话 框 样式 


FishC Demo ES] 


Q aa 
me | o | 


askokcancel(title, message, options) 
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续 表 
4e Rb UE AE 对 话 框 样式 


FishC Demo 


@ ue 
是 (Y) | A(N) | 


askquestion(title, message, options) 


FishC Demo E 


ih. 启动 失败 , 重 试 ? 


askretrycancel( title, message, options) 


重 试 (R) | 取消 | 

FishC Demo 
o 你 是 鱼油 吗 ? 

是 (Y) | A(N) | 


askyesno(title, message, options) 


FishC Demo = 


e 出 错 啦 ~ ! 
| 


showerror(title, message, options) 
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续 表 
4e Rb UE 对 话 框 样式 


FishC Demo | —- 
© EFA, EEC 
showinfo(title, message, options) | 


Ooae | 


FishC Demo EN 


PSI 


showwarning(title» message: options) 


ELI 


1. 参数 


所 有 的 这 些 函 数 都 有 相同 的 参数 . 
。 title 参数 弓 庸 置疑 是 设置 标题 栏 的 文本 。 
* message 参数 是 设置 对 话 框 的 主要 文本 内 容 , 可 以 用 \n' 来 实现 换行 。 
* options 参数 可 以 设置 的 选项 和 含义 如 表 15-10 所 示 。 
X 15-10 options 参数 可 以 设置 的 选项 和 含义 
选项 含 义 
1. 设置 默认 的 按钮 (也 就 是 按 下 回 车 啊 应 的 那个 按钮 ) 


default | 2. 默认 是 第 一 个 按钮 ( 像 * 确 定 >“ 是 ?或 * 重 试 ”) 
3. 可 以 设置 的 值 根 据 对 话 框 函数 的 不 同 可 以 选择 : CANCEL IGNORE .OK NO, RETRY 或 YES 


1. 指定 对 话 框 显示 的 图 标 
icon 2. 可 以 指定 的 值 有 : ERROR, INFO, QUESTION 或 WARNING 
3. 注意 : 不 能 指定 自己 的 图 标 


l. 如 果 不 指定 该 选项 ,那么 对 话 框 默认 显示 在 根 窗口 上 
2. 如 果 想 要 将 对 话 框 显示 在 子 窗口 w 上 ,那么 可 以 设置 parent^w 


parent 


2. 返回 值 
askokcancel() ,askretrycancel() 和 askyesno() 返 回 布尔 类 型 的 值 : 
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。 返回 True 表示 用 户 单 击 了 “确定 ”或 “是 ”按钮 。 

。 返回 False 表示 用 户 单 击 了 “取消 ”或 “ 否 ” 按 钮 。 

askquestion() 人 返回"yes" 或 "no" 字 符 串 表示 用 户 单 击 了 “是 ”或 “ 否 ” 按 钮 。 

showerrorO .showinfoO fl showwarning() 人 返回 "ok" 表 示 用 户 单 击 了 “是 ”按钮 。 

15.24.2  filedialog (文件 对 话 框 ) 

当 应 用 程序 需要 使 用 打开 文件 或 保存 文件 的 功能 时 ,文件 对 话 框 显得 尤为 重要 。 实 现 起 
来 就 是 这 样 : 


# p15_62. py 
from tkinter import * 


root = Tk() 
def callback(): 
fileName = filedialog. askopenfilename( ) 
print(fileName) 
Button(root, text = "打开 文件 "，command = callback). pack() 
mainloop() 


程序 实现 如 图 15-92 所 示 。 


/ 打开 ES 


EHTED: | 下 mu "| + 外 对 图 


T2246 


1.png 3.png 
5 
LS Faht Deme UN 
这 台电 脑 — 
6 “> “= dh, vm tmm 
Ris 


7.png tk1.py 


" wv 
文件 类 型 (T): [al Files œ.) 本 _ m» | 


Á 


15-92 文件 对 话 框 
filedialog 模块 提供 了 两 个 卫 数 ; askopenfilename( ** option) 和 asksaveasfilename( ** option), 
分 别 用 于 打开 文件 和 保存 文件 。 
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1. 参数 
两 个 函数 可 供 设 置 的 选项 是 一 样 的 , 表 15-11 列举 了 可 用 的 选项 及 含义 。 
表 15-11 可 用 选项 及 含义 


选 项 含 X 


指定 文件 的 后 级 ,例如 : defaultextension ". jpg" ,那么 当 用 户 输入 一 个 文件 名 "FishC" 的 
defaultextension | 时候, 文件 名 会 自动 添加 后 级 为 "FishC. jpg"。 注 意 : 如 果 用 户 输 入 文件 名 包含 后 级 , 那 


么 该 选项 不 生效 
指定 筛选 文件 类 型 的 下 拉 菜 单 选 项 ,该 选项 的 值 是 由 2 元 组 构成 的 列表 。 每 个 2 元 组 由 
filetypes (类 型 名 ,后 级) 构成 ,例如 ,filetypes=[("PNG", ". png")，("JPG"，". jpg")，("GIF"， 
". gif") ] 
initialdir 指定 打开 /保存 文件 的 默认 路 径 。 默 认 路 径 是 当前 文件 夹 


如 果 不 指定 该 选项 ,那么 对 话 框 默认 显示 在 根 窗口 上 。 如 果 想 要 将 对 话 框 显示 在 子 窗口 
w 上 ,那么 可 以 设置 parent=w 


title 指定 文件 对 话 框 的 标题 栏 文本 


parent 


2. 返回 值 


。 如 采用 户 选 择 了 一 个 文件 ,那么 返回 值 是 该 文件 的 完整 路 径 。 
。 如 采用 户 单 击 了 取消 按钮 ,那么 返回 值 是 空 字符 串 。 


15.24.3 colorchooser( 颜 色 选 择 对 话 框 ) 
颜色 选择 对 话 框 提供 一 个 让 用 户 选 择 颜 色 的 界面 ,请 看 下 面 的 例子 : 


# pl5 63. py 
from tkinter import * 


root - Tk() 

def callback(í): 
fileName = colorchooser. askcolor() 
print(fileName) 


Button(root, text = "Jt jf Bi fa", command = callback). pack() 


mainloop() 
程序 实现 如 图 15-93 所 示 。 
1. 参数 


askcolor(color. ** option) 图 数 的 color 参数 用 于 指定 初始 化 的 颜色 ,默认 是 浅 灰 色 ; 
option 参数 可 以 指定 的 选项 及 含义 如 表 15-12 所 示 。 
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图 15-93 ”颜色 选择 对 话 框 


X 15-12 option 参数 可 以 指定 的 选项 及 含义 


选项 


title 


parent 


指定 颜色 对 话 框 的 标题 栏 文本 


含 x 


选择 . 


Tkinter ||P 


如 果 不 指定 该 选项 ,那么 对 话 框 默 认 显示 在 根 窗口 上 。 如 果 想 要 将 对 话 框 显示 在 子 窗口 w 上 , 那 


么 可 以 设置 parent— w 


2. 返回 值 


。 如 果 用 户 选 择 一 


个 颜色 并 单 击 “ 确 定 ” 按 钮 后 ,返回 值 是 一 


择 的 RGB 颜色 值 ,第 2 个 元 系 是 对 应 的 十 六 进 制 颜色 值 。 


。 如 果 用 户 单 击 "取消 ?按钮 ,那么 ; 


返回 值 是 (None，、None) 。 


个 二 元 组 ,第 1 个 元 素 是 选 
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Pygame: 游戏 开发 


(16.1 安装 Pygame 


让 

在 Python 中 提 和 到 游戏 开发 Jb T3 4E dE Pygame 55/8 f, Pygame 是 一 个 利用 库 实 现 
的 模块 。( 注 : SDL(Simple DirectMedia Layer) 是 一 套 开 放 源 代码 的 跨 平台 多 媒体 开发 库 , 使 
H CHASER, SDL 提供 了 数 种 控制 图 像 、 声 音 、 输 出 入 的 函数 ,让 开发 者 只 要 用 相同 或 是 相 
似 的 代码 就 可 以 开发 出 跨 多 个 平台 (Linux、Windows、Mac OS X 等) 的 应 用 软件 。 目 前 SDL 
多 用 于 开发 游戏 ,模拟 器 、 媒 体 播放 如 等 多 媒体 应 用 领域 )。 

Pygame fH Fl; www. pygame. org, 

我 们 看 到 Pygame 的 LOGO RÉZ . Je — 2 Ei v] E — P Uo T . A E] 16-1 所 示 。 


图 16-1 Pygame 的 LOGO 


单 击 Downloads 按钮 ,可 以 找到 对 应 Python 版 本 的 Pygame 模块 ,如 图 16-2 所 示 。 


图 16-2 Pygame 的 下 载 地址 


这 里 有 几 点 需要 注意 : 
e pygame-1.9.1 的 1.9.1 是 Pygame 的 版 本 号 。 
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e pygame-1. 9. 2a0 的 a 表示 alpha 版 本 (测试 版 ) ,一 般 开 发 周期 为 : pre-alpha -> alpha -> 
beta -> release, 
* 升级 Pygame UI Ts 3€ CIR IH CIS 
。 目前 提供 的 Pygame 基本 上 都 是 32 位 版 本 ,因此 需要 先 安装 32 位 的 Python, 
本 书 使 用 的 是 pygame-1. 9. 2a0. win32-py3. 4. msi, 安 装 包 在 附件 中 可 以 找到 ,下 载 之 后 
直接 默认 安装 即 可 。 
OK ,安装 完成 后 ,打开 IDLE: 


>>> import pygame 
>>> print( pygame. ver) 
1.9.2a0 


成 功 打 印 版 本 号 ,说 明 安 装 正确 。 如 果 出 现 “ImportError: DLL load failed: %1 不 是 有 
效 的 Win32 应 用 程序 ,” 错 误 ,请 检查 你 的 Python 版 本 是 不 是 64 位 的 。 目 前 提供 的 Pygame 
是 32 位 的 ,因此 Python 也 需要 安装 对 应 的 32 位 版 本 。 

作为 一 个 游戏 模块 ,Pygame 实现 的 功能 主要 有 : 

。 绘制 图 形 。 

。 显示 图 片 。 

。 动画 效果 。 

。 与 键盘 、 和 鼠标 和 游戏 手柄 等 外 设 交互 。 

。 播放 声音 。 

。 碰撞 检测 。 


46.2 初步 尝试 
— € 


EMI 


这 是 本 书 最 后 一 个 章节 ,现在 对 于 大 家 来 说 ,最 好 的 学 习 方 法 应 该 是 直接 钻 进 代码 里 
LES 


# pl6 l/turtle.py 
import pygame 
import sys 


pygame. init() # 初始 化 Pygame 

size - width, height - 600, 400 

speed = [-2, 1] 

bg = (255, 255, 255) 

Screen - pygame.display.set mode(size) # 创建 指定 大 小 的 窗口 
pygame. display. set_caption(" 初 次 见面 ,请 大 家 多 多 关照 !") # 设置 窗口 标题 
turtle = pygame. image. load(" turtle. png") 

position = turtle.get rect() # 获得 图 像 的 位 置 和 矩形 


while True: 
for event in pygame. event. get( ) : 
if event. type == pygame. QUIT: 
sys. exit() 
position = position. move( speed) # 移动 图 像 
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if position. left < 0 or position. right > width: 
turtle = pygame.transform.flip(turtle, True, False) # 翻转 图 像 


speed[0] = - speed[0] # 反方 向 移动 
if position. top < 0 or position. bottom > height: 
speed[1] = - speed[1] 
screen. fill(bg) # 填充 背景 
screen. blit(turtle, position) # 更 新 图 像 
pygame. display. flip() # 更 新 界面 
pygame. time. delay( 10) # 延迟 10 毫秒 
程序 实现 如 图 16-3 所 示 。 
es 初次 见面 ， 请 大 家 多 多 关照 ! 一 口 E 


SN 


图 16-3 第 一 个 Pygame 游戏 


这 是 一 个 简单 的 演示 : 小 乌 包 会 不 断 地 移动 ,并 且 每 当 移 动 到 窗口 的 左右 边界 的 位 置 , 还 
会 自动“ 掉头”。 

代码 分 析 : 

pygame 其 实 是 一 个 包 ,里 边 包 含 着 很 多 不 同 功能 的 模块 。 开 头 的 pygame. init() 就 是 用 
于 初始 化 这 些 模块 ,让 它们 做 好 准备 ,随时 待命 。 


Screen = pygame.display.set mode(size) 


display. set mode O 7r i 8| $& —^ Surface 对 象 ,在 这 里 将 它 作 背景 画布 ,后 面 将 它 填充 
KAHE, 


turtle = pygame. image. load( "turtle. png") 


image. load() 方 法 用 于 加 载 图 片 , 不 得 不 说 Pygame HE Tkinter 要 “厚道 ”, 因为 Pygame 
不 仅 文 持 GIF 格式 ,还 文 持 时 下 流行 的 JPG、PNG、BMP 等 格式 的 图 片 。 

图 片 成 功 加 载 之 后 ,Pygame 会 帮 你 将 图 片 转换 为 一 个 Surface 对 象 并 人 返回。 要 让 小 乌龟 
移动 ,事实 上 就 是 不 断 修改 这 个 Surface 对 象 的 位 置 。 现 在 问题 来 了 了: 如 何 修改 ? 


position = turtle.get rect() 
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get_rect() 用 于 获得 该 Surface 对 象 的 矩形 区 域 , 其 实 这 个 矩形 区 域 也 是 一 个 对 象 , 主要 
用 来 描述 图 像 的 位 置 大 小 信息 。 
紧 接着 进入 一 个 “ 死 循 环 ”, 这 是 确保 游戏 可 以 不 断 地 运行 下 去 。 有 些 读者 可 能 会 纳 闽 本: 
那 怎 么 关闭 程序 ? 
for event in pygame. event. get( ) : 
if event. type == pygame. QUIT: 
sys. exit() 
学 过 了 界面 编程 ,我 们 已 知道 事件 和 事件 循环 。Pygame 也 是 如 此 ,用 户 的 一 切 行为 都 会 
变 成 一 个 个 事件 消息 , 放 入 事件 队列 里 边 。 那 么 这 里 就 是 迭代 获取 每 个 事件 消息 ,检测 如 果 是 
QUIT( 退 出 ) 事 件 , 那 么 就 调用 sys. exit() 退 出 程序 。 
position = position. move( speed) 
Rect 对 象 拥有 一 个 move() 方 法 ,用 于 移动 该 矩形 区 域 , 事 实 上 就 是 修改 该 矩形 的 坐标 。 
接 下 来 很 简单 ,我 们 判断 移动 后 的 矩形 区 域 是 否 位 于 窗口 的 边界 之 外 ,如 果 出 界 了 ,那么 
要 把 移动 的 方 问 修改 一 下 。 


turtle = pygame. transform. flip(turtle, True, False) 
小 乌 包 每 次 “撞墙 ”之 后 都 会 “掉头 ”, 主 要 就 是 由 transform. flip() 方 法 实现 。 该 方法 用 于 
翻转 图 片 ,第 二 个 参数 表示 水 平 翻 转 , 第 三 个 参数 表示 垂直 翻转 。 


screen. fill(bg) 
screen.blit(turtle, position) 


这 两 句 用 于 填充 背景 颜色 和 将 移动 后 的 小 乌龟 放 上 去 。 没 错 ,Surface 对 象 的 blitO 7r iE 
就 是 用 于 将 一 个 Surface 对 象 放 到 另 一 个 Surface 对 象 上 方 。 


pygame. display. flip() 

最 后 要 做 的 就 是 刷新 画面 ,由 于 Pygame 采用 的 是 双 绥 冲模 式 , 因 此 需要 调用 display. flipO 
方法 将 缓冲 好 的 画面 一 次 性 刷新 到 显示 器 上 。 所 谓 双 缓冲 , 即 在 内 存 中 创建 一 个 与 屏幕 绘图 
区 域 一 致 的 对 象 , 先 将 图 形 绘制 到 内 存 中 的 这 个 对 象 上 ,再 一 次 性 将 这 个 对 象 上 的 图 形 复制 到 
屏幕 上 ,这样 能 大 大 加 快 绘 图 的 速度 以 及 避免 闪烁 现象 。 


pygame. time.delay(10) 


当 这 一 切 都 完成 之 后 ,调用 time. delay() 方 法 让 程序 挂 起 10 毫秒 ,这 样 小 马 怨 才 不 会 跟 
AF X— FE SI RLE . 


16.3 解 惑 


16.3.1 什么 是 Surface 对 象 


什么 是 Surface 对 象 呢 ? 简单 来 说 Surface 对 象 就 是 Pygame 用 来 表示 图 像 的 对 象 。 所 以 
以 后 说 图 像 ,就 是 指 Surface 对 象 ,说 Surface 对 象 , 就 是 指 图 像 。 
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16.3.2 将 一 个 图 像 绘制 到 另 一 个 图 像 上 是 怎么 一 回 事 
Surface 对 象 的 blit() 方 法 是 将 一 个 图 像 绘 制 到 另 一 个 图 像 上 ,如 图 16-4 所 示 。 
Ee 初次 见面 ， 请 大 家 多 多 关照 ! —-UmL 


16-4 blitOJri€ 


上 面 是 两 个 Surface 对 象 ,一 个 是 作为 背景 的 白色 画布 ,一 个 是 加 载 图 片 并 转换 得 到 的 小 
马 怨 。 那 请 问 ,现在 在 我 们 面前 的 是 一 个 图 像 还 是 两 个 图 像 ? 

答案 是 一 个 ! 

我 们 知道 图 像 是 由 像素 组 成 的 ,例如 我 把 小 乌龟 的 眼睛 放大 ,大 家 就 可 以 清楚 地 看 到 其 实 
是 由 一 些 带 颜色 的 马赛 殉 组 成 的 ,而 这 些 马 赛区 , 称 为 像素 ,如 图 16-5 所 示 。 


16-5 BŽ 


用 blit 〇 方法 将 一 个 图 像 放 到 另 一 个 图 像 上 ,其 实 并 不 是 真 的 把 一 个 图 像 复制 上 去 ,事实 
上 Pygame 只 是 修改 其 中 一 个 图 像 某 些 位 置 的 像素 颜色 ,从 而 达到 覆盖 的 效果 。 
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16.3.3 -移动 图 像 是 怎么 一 回 事 
图 像 移 动 以 及 移动 的 快慢 涉及 帧 率 问 题 ,在 游戏 开发 和 视频 制作 中 我 们 都 经 常 听 到 帧 这 


个 关键 词 。 帧 率 就 是 一 秒 钟 可 以 切换 多 少 次 图 像 。 刚 才 提 到 Pygame 支持 40 一 200 帧 ,说 的 
就 是 Pygame 支持 每 秒 钟 切换 40 一 200 次 图 像 。 


那么 小 乌龟 是 如 何 移动 的 呢 ? 看 下 面 的 代码 : 


position = position.move(speed) # 移动 图 像 


screen. fill(bg) # 填充 背景 
screen. blit(turtle, position) # 更 新 图 像 
pygame. display. flip() # 更 新 界面 


调用 Rect 对 象 的 move() 方 法 ,事实 上 就 是 修改 这 个 矩形 范围 的 位 置 ,例如 这 里 speed 是 


[一 2, 1], 那 么 每 次 调用 move() 方 法 ,就 相当 于 水 平 位 置 一 2 ,垂直 位 置 十 1 的 意思 。 


位 置 移 动 后 调用 screen. fill() 将 整个 背景 画布 刷 晶 ,这样 位 于 上 一 个 位 置 的 小 马 怨 也 就 


被 同时 刷 反 了 。 然 后 将 当前 移动 位 置 后 的 小 马 龟 用 blit() 方 法 画 上 去 (事实 上 就 是 修改 背景 
画布 中 小 乌龟 位 置 的 像素 颜色 )。 最 后 用 flip() 方 法 将 整个 修改 好 的 新 界面 显示 出 来 。 而 我 
们 讲 的 帧 率 ,就 是 指 最 后 flip() 的 更 新 速度 。 


16.3.4 如 何 控制 游戏 的 速度 
由 于 怕 我 们 的 小 乌龟 乱 富 , 可 以 用 time 模块 的 delay() 方 法 增加 延迟 ,延迟 就 是 啥 都 不 准 


o time 模块 其 实 有 个 Clock 类 ,可 以 用 来 实现 帧 率 的 控制 : 


clock = pygame.time.Clock() # 实例 化 Clock 对 象 


# 创建 指定 大 小 的 窗口 


# pygame. time. delay(10) 
clock.tick(200) # 设置 不 高 于 200 帧 执行 


通过 调用 Clock 的 tick() 方 法 来 设置 帧 率 , 这 里 将 参数 设置 为 200 ,表示 每 秒 钟 不 得 超过 


200 帧 的 速度 执行 。 通 常用 这 个 方法 来 控制 游戏 的 速度 。 不 妨 可 以 试 试 将 帧 率 设 置 为 1, 那么 
就 可 以 看 到 一 秒 钟 小 乌 包 就 只 移动 一 下 。 


16.3.5 Pygame 的 效率 高 不 高 
有 读者 朋友 可 能 会 关心 效率 问题 ,因为 Python 虽然 简洁 好 用 ,但 效率 不 高 。 而 游戏 开发 


对 性 能 有 苛刻 的 追求 ,例如 在 复杂 的 绘制 环境 中 ,可 以 保持 越 高 的 帧 率 , 那 么 游戏 体现 出 来 的 
流畅 度 就 越 高 。Pygame 里 边 的 大 部 分 模块 考虑 到 效率 的 原因 ,都 是 由 CC 语言 写成 并 优化 的 。 
因此 ,效率 方面 肯定 不 在 话 下 ,官方 的 数据 显示 是 40 一 200 帧 每 秒 执行 任何 Pygame 游戏 ,而 
一 般 30 帆 被 认为 是 可 以 接受 的 流畅 度 。 
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16.3.6 我 应 该 从 哪里 获得 帮助 


官网 (http://www. pygame. org)( 可 以 说 Pygame 的 官网 已 经 做 得 相当 不 错 了 ) 中 各 种 文 
档 、 资 料 、 演 示 代 人 码 都 很 齐全 。 但 很 多 读者 可 能 看 不 懂 身 文 文档 ,国内 目前 也 没有 关于 
Pygame 文档 的 翻译 计划 。 于 是 咱 包 CC 诞生 了 Pygame 大 文档 版 块 (Pygame 游戏 开发 帮助 文 
档 : http://bbs. fishc. com/forum-323-1. html). 


46.4 事件 


ToPÀEATP IOTER S; fg eee 而 事件 , 正 是 Pygame 提供 了 干预 的 机 制 。 例 如 当 用 户 看 烦 了 小 
乌龟 ,可 以 单 击 关闭 按钮 ,就 会 产生 QUIT 事件 。 代 码 处 理 QUIT 事件 的 方法 就 是 调用 
sys. exit() 方 法 退出 程序 。 

事件 随时 可 能 发 生 ( 例 如 用 户 在 窗口 上 边 移动 鼠标 、 单 击 鼠 标 、 裔 击 按键 等 ),Pygame 的 
做 法 是 把 所 有 的 事件 都 存放 到 事件 队列 里 。 通 过 for 语句 迭代 取出 每 一 条 事件 ,然后 处 理 关 
注 的 事件 即 可 。 

下 面 的 代码 将 程序 运行 期 间 产生 的 所 有 事件 记录 并 存放 到 一 个 文件 中 : 

# p16 2/pg 1.py 


import pygame 
import sys 


pygame. init() 

size = width, height = 600, 400 

Screen = pygame.display.set mode(size) 
pygame.display.set caption("FishC Demo") 
f = open("record.txt", 'w') 


while True: 
for event in pygame. event. get() : 
f.write(str(event) + '\n') 
if event. type == pygame. QUIT: 
f.close() 
sys. exit() 

虽然 程序 停留 的 时 间 不 长 , 却 产 生 了 不 少 的 事件 ,如 图 16-6 所 示 。 

接 下 来 让 这 些 事件 可 以 “ 剧 刷 剧 "地 显示 在 画面 上 ,这 应 该 会 很 酷 ! 那么 这 就 涉及 要 在 屏 
幕 上 显示 文字 的 功能 ,或 者 说 要 求 我 们 在 Surface 对 象 上 显示 文字 。 遗 憾 的 是 ,Pygame 没有 
办 法 直接 在 一 个 Surface 对 象 上 面 显 示 文 字 ,因此 需要 调用 font 模块 的 render() 方 法 ,该 方法 
是 将 要 显示 文字 活生生 地 泻 染 成 一 个 Surface 对 象 , 这 样 就 可 以 调用 blit () 方 法 将 一 个 
Surface 对 象 放 到 男 一 个 上 面 。 

# p16 2/pg 2.py 


import pygame 
import sys 
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Ir record.txt - 记事 本 - o EE 
文件 (F) 编辑 (日 AO) ESV) RH) 


<Event (17-VideoExpose {})> 
《Event (16-VideoResize Uv 600, 'h': 400, 'size': (600, 400)))» 
XEvent(l-ActiveEvent f gain' : 0, 'state' : 1})> 
《Event (4-MouseMotion { pos' : (599, 399), 'buttons': (0, 
XEvent (1-ActiveEvent 人 gain : l, 'state : 1})> 
«Event (4-MouseMotion Pos, : (587, 336), 'buttons : 
«Event (4-MouseMotion : (565, "buttons : ( 
XEvent (4-MouseMot ion : s ' buttons : 
XEvent (4-MouseMotion ' buttons’ : 
《Event (4-MouseMotion “buttons : ( 
《Event (4-MouseMot ion "buttons : ( 
《Event (4-MouseMotion ' buttons : 
XEvent (4-MouseMot ion 'buttons' : 
《Event (4-MouseMot ion "buttons : 
«Event (4-MouseMotion ' buttons’ : 
《Event (4-MouseMot ion ' buttons’ : 
《Event (4-MouseMot i on "buttons : 
XEvent (4-MouseMotion { "buttons : 
XEvent (2-KeyDown { key : 'scancode': 30, 
XEvent (4-MouseMotion { po (468, 269), ` buttons’ : 
《Event (4-MouseMotion { pos’: (469, 269), 'buttons : 
《Event (4-MouseMotion [ pos’: (470, 268), 'buttons': 
《Event (4-MouseMotion { pos : (471, 267), 'buttons : 
XEvent (4-MouseMotion { pos : (472, 266), ` buttons’ : 
XEvent(3-KeyUp { scancode : 30, "key : 97, 'mod : 0})> 
ion { 14, 265), ` buttons : 
263), ` buttons’ : 
262), ` buttons’ : 
<Event (4-MouseMotion : (479, 260), 'buttons' : ( 
《Event (4-MouseMotion { pos : 260), ' buttons : 
260), ` buttons’ : 
XEvent(4-MouseMotion {pos : (483, 260), "buttons : 
XEvent (2-KeyDown { key : 98, 'scancode' : 48, j 
i s (495, 254), 'buttons : 
《Event (4-MouseMotion [ po (487, 250), buttons : 
XEvent (4-MouseMotion { po : (486, 249), "buttons A | 
{Event (3-KeyUp { i : 48, ' key’: 98, "mod : 0})> 
XEvent(4-MouseMotion { pos’ i - (486, 248), 'buttons' : 
XEvent (4-MouseMotion t pos': (486, 241), "buttons , 
XEvent(2-KeyDown ('key': 99, 'scancode': 46, i 
XEvent(4-MouseMotion { pos’: (487, 247), 'buttons': 
XEvent (3-KeyUp { scancode : 'key : 99, 'mod : 
Event (2-KeyDown { key’ : 
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16-6 事件 


pygame. init() 

size = width, height = 600, 400 

bg = (0, 0, 0) 

screen = pygame. display. set_mode( size) 
pygame.display.set caption("FishC Demo") 
event texts - [] 

# 要 在 Pygame 中 使 用 文本 ,必须 创建 Font 对 象 
# 第 一 个 参数 指定 字体 ,第 二 个 参数 指定 字体 的 尺寸 
font = pygame. font. Font(None, 20) 

# 调用 get linesize( ) 方 法 获得 每 行文 本 的 高 度 
line height = font.get linesize() 

position = 0 

screen. fill(bg) 


while True: 
for event in pygame. event. get( ) : 
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if event. type == pygame. QUIT: 
sys. exit() 
# render() 方 法 将 文本 演 染 成 Surface 对 象 
# 第 一 个 参数 是 待 泻 染 的 文本 
# 第 二 个 参数 指定 是 否 消除 锯齿 
# 第 三 个 参数 指定 文本 的 颜色 
screen.blit(font.render(str(event), True, (0, 255, 0)), (0, position)) 
position *- line height 
if position » height: 
# 满 屏 时 清 屏 
position = 0 
screen. fill(bg) 
pygame. display.flip() 


X 16-1 列举 了 Pygame 第 用 的 事件 及 含义 。 


X 16-1 Pygame 常用 的 事件 及 含义 

事 件 含 义 属 性 
ATIVEEVENT gain, state 
KEYDOWN unicode, key, mod 
KEYUP 键盘 按键 被 松 开 key, mod 
MOUSEMOTION pos, rel, buttons 
MOUSEBUTTONDOWN pos, button 
MOUSEBUTTONUP pos, button 
JOYAXISMOTION joy. axis, value 
JOYBALLMOTION joy: axis, value 
JOYHATMOTION joy, axis, value 
JOYBUTTONDOWN joy, button 
JOYBUTTONUP 游戏 手柄 按钮 被 松 开 joy，button 
VIDEORESIZE 用 户 调 整 窗 口 的 尺 十 size, w, h 
VIDEOEXPOSE 部 分 窗口 需要 重新 绘制 none 


USEREVENT 用 户 定 义 的 事件 code 


既然 已 经 知道 了 这 么 多 , 想 让 狗 狂 的 小 马 怨 受 控制 应 该 也 不 是 什么 难事 了 吧 ? 


# p16_2/pg_3. py 

import pygame 

import sys 

from pygame. locals import * # 将 pygame 的 所 有 常量 名 导入 


pygame. init() 

size = width, height = 600, 400 

bg = (255, 255, 255) 

speed = [0, 0] 

clock = pygame. time. Clock() 

screen = pygame. display. set_mode( size) 

pygame. display. set_caption(" 初 次 见面 ,请 大 家 多 多 关照 !") 
turtle = pygame. image. load(" turtle. png") 

position = turtle.get rect() 
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l head = turtle # 包头 朝 左 
r head = pygame.transform.flip(turtle, True, False) # 包头 朝 左 


while True: 
for event in pygame. event. get( ) : 
if event. type == QUIT: 
sys. exit() 
if event. type == KEYDOWN: 
if event.key -- K LEFT: 
speed = [- 1, 0] 
turtle = 1 head 
if event. key == K RIGHT: 
speed - [1, 0] 
turtle - r head 
if event.key -- K UP: 
speed = [0, - 1] 
if event.key -- K DOWN: 
speed = [0, 1] 
position = position. move( speed) 
if position. left < 0 or position. right > width: 
# 翻转 图 像 
turtle = pygame.transform.flip(turtle, True, False) 
# 反方 向 移动 
speed[0] = - speed[0] 
if position. top < 0 or position. bottom > height: 
speed[1] = - speed[1] 
screen. fill(bg) 
screen.blit(turtle, position) 
pygame. display.flip() 
clock. tick(30) 


46.5 ”提高 游戏 的 颜 值 
— 
3 f ELSE > r DIETS Ao TRU s s SU] DE OU b K E E BR ER 


16.5.1 显示 模式 


前 面 通过 display 模块 的 set_mode() 方 法 来 指定 界面 的 大 小 ,并 返回 一 个 Surface 对 象 。 
set_mode() 方 法 的 原型 如 下 : 


set mode(resolution- (0,0), flags = 0, depth- 0) -> Surface 

第 一 个 参数 resolution 用 于 指定 界面 的 大 小 。 一 般 会 指定 一 个 具体 的 尺寸 ,如 果 你 什么 
都 不 给 它 ,或 者 使 用 默认 的 (0, 0) ,那么 Pygame 会 根据 当前 的 屏幕 分 辩 率 创建 一 个 窗口 (SDL 
版 本 低 于 1.2.10 会 抛 出 异常 )。 

第 二 个 参数 flags 用 于 指定 扩展 选项 。 同 时 指定 多 个 选项 可 以 用 管道 操作 符 (|) 隔 开 ， 
表 16-2 列举 了 各 个 选项 及 其 含义 。 
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表 16-2 flags 可 用 的 选项 及 含义 


选 项 * X 
FULLSCREEN 全 屏 模式 
DOUBLEBUF 双 缓 冲模 式 
HWSURFACE 硬件 加 速 支 持 ( 只 有 在 全 屏 模 式 下 才能 使 用 ) 
OPENGL 使 用 OpenGL W ġe 
RESIZABLE 使 得 窗口 可 以 调整 大 小 
NOFRAME 使 得 窗口 没有 边框 和 控制 按钮 


第 三 个 参数 depth 用 于 指定 颜色 位 数 。 一 般 这 个 值 不 推荐 设置 ,因为 Pygame 会 自动 根 
据 当 前 操作 系统 设置 最 合适 的 颜色 位 数 。 


16.5.2 -全 屏 才 是 王道 


大 家 有 没有 发 现 : 我 们 玩 的 很 多 游戏 都 是 全 屏 模式 ,你 知道 为 什么 吗 ? 因为 全 屏 的 好 处 
太 多 了 ,例如 可 以 显示 更 多 的 内 容 , 可 以 开局 硬件 加 速 ,最 重要 的 一 点 是 可 以 霸占 着 整个 屏幕 ， 
其 他 的 软件 都 一 边 站 去 。 

开局 全 屏 模式 很 简单 ,只 需要 设置 第 二 个 参数 为 FULLSCREEN 即 可 ,同时 可 以 加 上 人 硬 
件 加 速 HWSURFACE: 


Screen = pygame.display.set mode((640, 480), FULLSCREEN | HWSURFACE) 


WEE e 2 S a TAR pd fx FE 2E Jc TE f Ri f H1 E BEER X , 稍 后 就 很 难 退 出 
Y GU RASSE B. ZSEA EF A4 BEBUX ,请 用 热 键 Ctrl-Alt-Delete 退出 ) 。 所 以 ,应 该 添加 一 个 快 
捷 键 使 得 全 屏 模式 得 到 控制 : 


# p16 3/pg 1. py 


fullscreen = False 


# 全 屏 (F11) 
if event.key == K F11: 
fullscreen = not fullscreen 
if fullscreen: 
screen = pygame. display. set_mode( (1920, 1080), \ 
FULLSCREEN | HWSURFACE) 
else: 
screen = pygame. display. set_mode( size) 


为 了 确保 可 以 正常 关闭 程序 ,使 用 F11 作为 切换 全 屏 模式 到 窗口 模式 的 快捷 键 ,这 里 已 
知 显 示 器 的 当前 分 辩 率 是 1920X1080 像素 ,所 以 设置 全 屏 后 的 尺寸 为 显示 器 的 尺寸 。 但 是 你 
的 游戏 应 该 是 给 大 家 玩 的 ,所 以 不 同 机 需 的 显示 需 分 辩 率 不 可 能 完全 相同 ,所 以 你 需要 获得 当 
闻 显 示 需 支持 的 分 辩 率 。 可 以 用 list modes 方法 实现 : 

>>> pygame.display.list modes() 


[(1920, 1080), (1680, 1050), (1600, 900), (1440, 900), (1400, 1050), (1366, 768), (1360, 768), 
(1280, 1024), (1280, 800), (1280, 768), (1280, 720), (1024, 768), (800, 600), (640, 480), (640, 
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400), (512, 384), (400, 300), (320, 240), (320, 200)] 


"ill E Brz list modes() 返 回 一 个 列表 ,从 大 到 小 依次 列举 出 当前 显示 需 文 持 的 全 屏 分 
WK, 


16.5.3 使 窗口 尺寸 可 变 


Pygame 的 窗口 默认 是 不 可 通过 拖 动 边框 来 修改 太 才 的 ,因为 游戏 角色 ,场景 都 是 按照 一 
定 的 比例 来 设计 的 ,给 你 这 么 一 拖 一 搜 , 男 主 一 号 都 变 成 面目 钴 铬 的 坏 重 了 ! 尽管 如 此 ,通过 
设置 RESIZABLE 选项 还 是 可 以 实现 的 : 


# 这 里 由 于 空间 有 限 , 省略 了 大 部 分 代码 ,完整 代码 可 查阅 源 文件 
# p16 3/pg 2.py 


Screen = pygame.display.set mode(size, RESIZABLE) 


# 用 户 调 整 窗口 尺寸 
if event.type == VIDEORESIZE: 
size - event.size 
width, height - size 
print(size) 
Screen = pygame.display.set mode(size, RESIZABLE) 


开启 了 窗口 尺寸 可 修改 选项 后 ,一 旦 用 户 调 整 窗口 的 尺寸 ,Pygame 就 会 发 送 一 条 市 有 最 
新 尺寸 的 VIDEORESIZE 事件 到 事件 序列 中 。 程 序 随即 做 出 响应 ,重新 设置 width 和 height 
的 值 并 重建 一 个 新 尺寸 的 窗口 。 


16.5.4 图 像 的 变换 


想 要 让 程序 实现 更 加 炫 酯 的 特技 效果 ,你 的 图 像 还 需要 能 够 文 持 一 些 变换 才 行 。 例 如 左 
右上 下 翻转 , 按 角 度 转 动 ,放大 缩小 ……Pygame 的 transform 模块 使 得 你 可 以 对 图 像 ( 也 就 是 
Surface 对 象 ) 做 各 种 变换 动作 ,并 返回 变换 后 的 Surface 对 象 。 表 16-3 列举 了 了 transform 模块 
几 个 常用 的 方法 及 作用 。 


表 16-3 transform 模块 的 常用 方法 及 作用 


is WENK RAR 
- VIALE ORO 
rotate SEL 


JE 3: transform 模块 的 这 些 方法 都 是 像素 转换 的 把 戏 ,原理 是 通过 使 用 一 定 的 算法 对 图 
片 进行 像素 位 置 修改 。 大 多 数 方法 在 变换 后 难免 会 有 一 些 精度 的 损失 (flip() 方 法 不 会 ), 因 此 
不 建议 对 变换 后 的 Surface 对 象 进行 再 次 变换 。 

在 前 面 小 乌 包 的 例子 中 ,就 是 采用 flip() 方 法 让 小 马 怨 可 以 在 撞墙 后 目 动 “ 拯 头 ”。 接 下 
来 修改 代码 ,实现 小 乌龟 的 缩放 : 
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# pl6 3/pg 3.py 


ratio = 1.0 # 设置 放大 缩小 比率 

oturtle = pygame. image. load("turtle. png") 
turtle = oturtle 

oturtle rect = oturtle.get rect() 
position - turtle rect - oturtle rect 


# AKR SISE =,- ), m FE RE 
if event. key == K EQUALS or event.key == K MINUS or event.key == K SPACE: 
# 最 大 只 能 放大 一 倍 ,缩小 50 % 
if event. key -- K EQUALS and ratio < 2: 
ratio += 0.1 
if event. key == K MINUS and ratio > 0.5: 


ratio -- 0.1 
if event. key == K SPACE: 
ratio - 1 


turtle = pygame. transform. smoothscale(oturtle, (int(oturtle rect. width * ratio), int 
(oturtle rect.height * ratio))) 

# 相应 修改 龟头 两 个 朝向 的 Surface 对 象 ,否则 一 单 击 移动 就 打 回 原形 

l head = turtle 

r head = pygame.transform.flip(turtle, True, False) 


# 获得 小 乌龟 缩放 后 的 新 尺寸 
turtle rect = turtle.get rect() 
position. width, position. height = turtle rect.width, turtle rect. height 


接 下 来 通过 rotate() 方 法 让 小 乌龟 实现 贴 边 行走 。 

先 来 分 析 以 下 : rotate (Surface. angle) 方法 的 第 二 个 参数 FS 
angle 指定 旋转 的 角度 ,是 逆 时 针 方 回 旋转 的 。 而 我 们 的 小 乌龟 是 
这 样 ,如 图 16-7 所 示 。 

每 次 90 度 的 逆 时 针 旋 转 结果 如 图 16-8 所 示 。 

因此 ,代码 这 么 写 : 


# p16 3/pg 4.py 图 16-7 ”小 乌龟 
import pygame 


F 


iN 


16-8 ” 道 时 针 旋 转 的 小 乌 包 


import sys 
from pygame. locals import * 


pygame. init() 
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size - width, height - 640, 480 
bg = (255, 255, 255) 


clock = pygame. time. Clock() 

Screen - pygame.display.set mode(size) 
pygame.display.set caption("FishC Demo") 

turtle = pygame. image. load("turtle. png") 

position = turtle rect = turtle.get rect() 

# 小 乌 包 顺 时 针 行 走 

speed = [5, 0] 

turtle right = pygame. transform. rotate(turtle, 90) 
turtle top = pygame. transform. rotate(turtle, 180) 
turtle left - pygame.transform.rotate(turtle, 270) 
turtle bottom - turtle 

* 刚 开 始 走 顶部 

turtle = turtle top 


while True: 

for event in pygame. event. get( ) : 

if event. type == QUIT: 
sys. exit() 

position = position. move( speed) 

if position. right > width: 
turtle = turtle_right 
# 变换 后 矩形 的 尺 才 发 生 改 变 
position = turtle rect = turtle.get rect() 
# 和 矩形 太 二 的 改变 导致 位 置 也 有 变化 
position. left = width - turtle rect.width 
speed = [0, 5] 

if position. bottom > height: 
turtle = turtle bottom 
position = turtle rect = turtle.get rect() 
position. left = width - turtle rect.width 
position.top = height - turtle rect. height 
speed = [-5, 0] 

if position. left < 0: 
turtle = turtle left 
position - turtle rect - turtle.get rect() 
position.top = height - turtle rect. height 
speed = [0, -5] 

if position. top < 0: 
turtle - turtle top 
position = turtle rect = turtle.get rect() 
speed = [5, 0] 

screen. fill(bg) 

screen.blit(turtle, position) 


pygame. display.flip() 
clock. tick(30) 


16.5.5 -裁剪 图 像 
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违 。 这 是 为 啥 呢 ? RAES fe hP ERBI E 50X 50 像素 后 ,看 看 是 什么 样子 ? 
大 家 看 下 前 后 对 比 图 ,调用 chop() 方 法 前 小 乌龟 眉 清 目 秀气 衬 轩 昂 ,如 图 16-9 Bron 


G FishC Demo 一 口 O 


S 


图 16-9 调用 chop() 方 法 前 
调用 chop() 后 小 马 怨 面 目 全 非 ,惨不忍睹 ,如 图 16-10 所 示 。 
[os FishC Demo 一 口 EESS 


16-10 调用 chop() 方 法 后 
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从 对 比 中 也 不 难看 出 这 个 chop() 方 法 是 将 指定 的 Rect 矩形 部 分 直接 去 掉 , 然 后 其 他 部 
分 拼凑 在 一 起 返回 Surface 对 象 。 

那 要 实现 真正 意义 上 的 裁剪 应 该 如 何 做 呢 ? 这 个 目前 对 我 们 来 说 有 点 小 难度 一 一 难点 就 
是 鼠标 每 次 按 下 到 释放 均 有 不 同 的 意义 。 

先 来 分 析 ,第 一 次 拖 动 鼠标 左 键 确定 裁剪 的 范围 ,如 图 16-11 所 示 。 
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16311 第 一 次 拖 动 鼠 标 确定 裁剪 的 范围 
第 二 次 拖 动 鼠标 左 键 裁剪 范围 内 的 图 像 ,如 图 16-12 所 示 。 


第 三 次 单 击 则 表示 重新 开始 ,如 图 16-13 所 示 。 

这 里 用 draw. rect() 来 绘制 矩形 ; 

rect(Surface, color, Rect, width- 0) -> Rect 

。 第 一 个 参数 指定 矩形 将 绘制 在 哪个 Surface 对 象 上 ; 

。 第 二 个 参数 指定 颜色 ; 

。 第 三 个 参数 指定 矩形 的 范围 (left, top, width, height); 

。 第 四 个 参数 指定 矩形 边框 的 大 小 (0 表示 填充 矩形 ) 。 

裁剪 操作 可 以 利用 subsurface() 方 法 来 获得 指定 位 置 的 子 图 像 ,然后 copy() 出 来 : 


capture = screen. subsurface(select rect).copy() 


正如 刚才 所 提 到 的 ,这 个 例子 的 难度 主要 在 于 区 分 每 次 单 击 的 操作 ,因此 不 妨 使 用 两 个 变 
量 来 做 标志 : 
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16-12 第 二 次 拖 动 鼠标 左 键 裁剪 范围 内 的 图 像 
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16-13 第 三 次 单 击 则 表示 重新 开始 
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# 0 -> 未 选择 ,1 -> 选择 中 ,2 -> 完成 选择 
Select = 0 

# 0 -> 未 拖 动 ,1 -> 拖 动 中 ,2 -> 完成 拖 动 
drag = 0 


if event.type == MOUSEBUTTONDOWN: 
if event. button == 


# 第 一 次 单 击 ,选择 范围 
if select == 0 and drag == 


select = 1 


# 第 二 次 单 击 , 推 搜 图 像 
elif select == 2 and drag == 0: 


drag - 1 

# 第 三 次 单 击 , 初 始 化 

elif select == 2 and drag == 2: 
select = 0 
drag = 0 

if event. type == MOUSEBUTTONUP: 
if event.button -- 1: 
# 第 一 次 释放 ,结束 选择 
if select == 1 and drag -- 0: 


select = 2 
# 第 二 次 释放 ,结束 拖 动 
if select == 2 and drag == 1: 
drag - 2 
screen. fill(bg) 
screen.blit(turtle, position) 
# 实时 绘制 选择 框 
if select: 


# mouse.get pos() 用 于 获取 鼠标 当前 位 置 


mouse pos = pygame.mouse.get pos() 


# 拖 动 裁剪 的 图 像 
if drag: 


# p16 4/Demo.py 

import pygame 

import sys 

from pygame.locals import * 


pygame. init() 

size - width, height - 800, 600 

bg = (255, 255, 255) 

clock = pygame. time.Clock() 

Screen = pygame.display.set mode(size) 
pygame.display.set caption("FishC Demo") 
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turtle = pygame. image. load("turtle. png") 
# 0 -> 未 选择 ,1 -> 选择 中 ,2 -> 完成 选择 
select = 0 

select rect = pygame.Rect(0, 0, 0, 0) 

# 0 -> 未 拖 动 ,1 -> 拖 动 中 ,2 -> 完成 拖 动 
drag = 0 

position = turtle.get rect() 

position. center = width // 2, height // 2 


while True: 
for event in pygame. event. get( ) : 
if event. type == QUIT: 
sys. exit() 
elif event. type == MOUSEBUTTONDOWN: 
if event. button == 
# 第 一 次 单 击 ,选择 范围 
if select == 0 and drag -- 
pos start = event. pos 
select - 1 
# 第 二 次 单 击 , 推 搜 图 像 
elif select == 2 and drag == 0: 
capture - screen. subsurface(select rect).copy() 
cap rect - capture.get rect() 
drag - 1 
# 第 三 次 单 击 , 初 始 化 
elif select == 2 and drag == 2: 
select = 0 
drag = 0 
elif event. type == MOUSEBUTTONUP: 
if event. button == 1: 
# 第 一 次 释放 ,结束 选择 
if select == 1 and drag -- 0: 
pos stop = event. pos 
select - 2 
# 第 二 次 释放 ,结束 拖 动 
if select -- 2 and drag == 1: 
drag - 2 
screen. fill(bg) 
screen.blit(turtle, position) 
# 实时 绘制 选择 框 
if select: 
mouse pos = pygame.mouse.get pos() 
if select == 
pos stop - mouse pos 
select rect.left, select rect.top - pos start 
select rect.width, select rect. height - pos stop[0] - pos start[0], pos stop[1] - 
pos start[1] 
pygame. draw. rect( screen, (0, 0, 0), select rect,1) 
# 拖 动 裁剪 的 图 像 
if drag: 
if drag == 
cap rect.center - mouse pos 


e 206 * 


lOS Pyme 游戏 开发 Me 


screen.blit(capture, cap rect) 


pygame. display.flip() 
clock. tick(30) 


16.5.6 转换 图 片 


印 文字 ,也 是 先 将 文字 转变 成 Surface X 2g Br" WS" p 22; 小 乌 钨 在 上 边 候 来 候 去 ,事实 上 就 是 
不 断 调 整 Surface 对 象 上 一 些 特定 像素 的 位 置 。 

image. load() 载 入 图 片 后 将 返回 一 个 Surface 对 象 , 此 前 我 们 一 直 拿 来 就 用 ,没有 对 其 进 
行 转换 ,这 是 效率 相对 较 低 的 做 法 。 如 果 你 希望 Pygame 尽 可 能 高 效 地 处 理 图 片 ,那么 应 该 在 
载 人 图 片 后 同时 调用 convert() 方 法 进行 转换 : 


background = pygame. image. load( "background. jpg" ). convert() 


有 读者 可 能 会 好 奇 : 不 是 说 image. load() 会 返回 一 个 Surface 对 象 吗 ?还 转换 个 哈 ? 

其 实 这 里 转换 的 是 “像素 格式 ”,image. load() 返 回 的 Surface 对 象 中 保留 了 原 图 像 的 像素 
格式 。 在 调用 blit() 方 法 的 时 候 , 如 果 两 个 Surface 对 象 的 像素 格式 不 同 ,那么 Pygame 会 实 
时 地 进行 转换 ,这 是 相当 费时 的 操作 。 

还 有 一 个 是 convert alphaO ,它们 有 什么 区 别 呢 ? 一 般 情况 下 用 RGB 来 描述 一 个 颜色 ， 
而 在 游戏 开发 中 常常 用 RGBA 来 描述 。 多 的 这 个 A 指 的 是 Alpha 通道 ,用 于 表示 透明 度 , 它 
的 值 也 是 0 一 255 ,0 表示 完全 透明 ,255 表示 完全 不 透明 。image. load() 文 持 多 种 格式 的 图 片 
导入 ,对 于 包含 alpha 通道 的 图 片 , 使 用 convert. alpha() 转 换 格 式 ,否则 使 用 convertO : 


turtle = pygame. image. load("turtle.png").convert alpha() 


16.5.7 透明 度 分 析 


Pygame 支持 三 种 类 型 的 透明 度 设置 : colorkeys, surface alphas 和 pixel alphas。 设 置 
colorkeys 是 指定 一 种 颜色 ,使 其 变 为 透明 。surface alphas 是 整体 设置 一 个 图 片 的 透明 度 。 
pixel alphas 为 每 个 像素 增加 一 个 alpha 通道 ,也 就 是 允许 设置 每 个 像素 的 透明 度 。colorkeys 
和 surface alphas 可 以 混合 使 用 ,而 pixel alphas 不 能 和 其 他 类 型 混合 。 

说 得 那么 复杂 ,其 实 就 是 由 convert() 方 法 转换 来 的 Surface 对 象 文 持 colorkeys 和 
surface alphas 设置 透明 度 ,并 且 可 以 混合 设置 。 而 convert_alpha() 方 法 转换 后 是 支持 pixel 
alphas ,也 就 是 这 个 图 片 本 身 每 个 像素 都 带 有 alpha 通道 (所 以 载 人 一 个 带 alpha 通道 的 png 
图 片 ,可 以 看 到 该 图 片 部 分 位 置 是 透明 的 )。 

接 下 来 做 个 实验 : 这 里 有 两 张 图 片 turtle. jpg 和 turtle. png, turtle. jpg 不 市 alpha 38 38 , 
turtle. png ^f? alpha 通道 ,并且 背 景 被 设置 为 透明 。 

首先 载 和 turtle. jpg. fii JH set_colorkey() 方 法 试图 将 白色 的 背景 透明 化 : 


# p16 5/pg 1.py 


turtle.set colorkey((255, 255, 255)) 
turtle.set alpha(200) 
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程序 实现 结果 并 不 是 很 优秀 ,如 图 16-14 所 示 。 
G FishC Demo 


16-14 使 用 set_colorkey() 方 法 试图 将 白色 的 背景 透明 化 
使 用 set_alpha() 方 法 将 调节 整个 图 片 的 透明 度 ,如 图 16-15 所 示 。 
G FishC Demo 一 DI 


图 16-15 使 用 set_alpha() 方 法 将 调节 整个 图 片 的 透明 度 
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另外 ,set_colorkey() 和 set_alpha() 是 可 以 混合 使 用 的 ,如 图 16-16 所 示 。 
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图 16-16 将 set_colorkey() 方 法 和 set_alpha() 方 法 混合 使 用 


最 后 是 pixel alphas,turtle. png 这 个 图 片 是 带 有 alpha 通道 的 ,并 且 背 景 被 设置 为 透明 ， 
因此 直接 载 人 后 可 以 看 到 透明 的 背景 ,如 图 16-17 所 示 。 
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图 16-17 turtle. png 这 个 图 片 是 带 有 alpha 通道 的 ,并 且 背 景 被 设置 为 透明 
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但 如 果 希 望 调节 小 乌 包 自身 的 透明 度 , 可 以 用 get_at() 获 取 单 个 像素 的 颜色 ,并 用 set atO 
来 修改 它 。get_at() 和 set_at() 使 用 的 是 RGBA 颜色 ,也 就 是 带 Alpha 通道 的 RGB 颜色 : 
print(turtle. get_at(position. center) ) 
因此 ,如 果 想 将 整个 小 乌 包 的 透明 度 调整 为 200 的 时 候 , 可 以 逐个 像素 修改 透明 度 ; 


# p16 5/pg 2.py 


for i in range(position. width): 
for j in range( position. height): 
temp = turtle.get at((i, j)) 
if temp[3] != 0: 
temp[3] = 200 
turtle.set at((i, j), temp) 


效果 竟然 还 是 不 理想 ,如 图 16-18 所 示 。 
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图 16-18 通过 逐个 设置 像素 值 将 整个 小 乌龟 的 透明 度 调整 为 200 


没关系 ,程序 是 死 的 ,程序 员 是 活 的 ! 这 里 教 大 家 一 个 新 技能 来 Get 这 个 问题 。 先 给 大 家 
看 解决 方案 ,再 分 析 : 


# pl6 5/pg 3.py 


def blit alpha(target, source, location, opacity): 
x = location[0] 
y = location[1] 
temp = pygame.Surface((source.get width(), source.get height())).convert() 
temp.blit(target, (— x, -y )) 
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temp.blit(source, (0, 0)) 
temp.set alpha(opacity) 


target.blit(temp, location) 


blit alpha(screen, turtle, position, 200) 


程序 实现 效果 如 图 16-19 所 示 。 
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16-19 调整 图 片 透明 度 的 新 技能 


咽 ,这 是 我 们 想 要 的 结果 ! 那 来 看 看 这 个 图 数 是 如 何 做 到 的 : 

(OD 首先 创造 一 个 不 带 alpha 通道 的 小 乌龟 ; 

(2) 然后 将 小 乌 包 所 在 位 置 的 背景 履 新 上 去 ; 

(3) 此 刻 temp 得 到 的 是 一 个 跟 小 乌 包 尺寸 一 样 大 小 ,上 边 绘 制 着 背景 的 Surface 对 象 ; 

(4) 将 带 alpha 通道 的 小 乌龟 覆盖 上 去 ; 

(5) 由 于 temp 是 不 融 alpha 通道 的 Surface 对 象 , 因 此 使 用 set_alpha() 方 法 设置 整个 图 
片 的 透明 度 ; 

(6) 最 后 将 设置 好 透明 度 的 temp“ 贴 ”到 指定 位 置 上 ,完成 任务 ! 


(t6. 绘制 基本 图 形 


于 一 个 游戏 来 说 有 多 重要 吗 ? 我们 学 Pygame 就 是 为 了 游戏 开发 , 那 绘制 基本 的 图 形 对 于 游 
戏 开 发 有 什么 用 ? 作者 你 这 是 在 目 己 打 腔 吗 ? 
其 实 , 绘 制 基 本 图 形 在 游戏 开发 中 并 不 是 没 用 ! 说 来 也 奇怪 ,最 近 很 火 的 游戏 反而 是 一 些 
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像素 游戏 ,尤其 是 一 些 由 简单 图 形 构成 的 小 游戏 。 总 结 了 一 下 有 几 点 原因 : 
(1) 唯美 的 游戏 界面 越 来 越 多 ,玩家 难免 出 现 审美 疲劳 ; 
(2) 时 下 盛行 极 简 风格 ,只 要 你 的 游戏 做 得 让 玩家 和 舒服, 一般 大 家 都 不 会 拒绝 简单 的 游戏 ; 
(3) 大 型 的 游戏 CG 动画 绘制 需要 耗费 相当 的 人 力 物力 和 财力 ; 
(4) 简单 的 游戏 更 容易 开发 ,小 游戏 工作 室 或 个 人 即 可 完成 开发 ,有 更 多 逆 效 的 机 会 ; 
(5) 游戏 依托 的 主要 平台 已 经 从 电脑 端 转移 到 手机 端 ,那么 小 一 个 屏幕 你 把 图 像 做 得 惟 
妙 惟 首 意义 并 不 大 。 其 实 衍 生出 来 还 有 很 多 原因 ,例如 手机 的 配置 差异 大 ,而 游戏 需要 尽 可 能 
满足 配置 低 的 手机 才能 获得 更 多 的 玩家 。 大 型 游戏 消耗 大 , 耗 电 、 散 热 都 是 一 个 需要 考虑 的 问 
题 。 另 外 ,简单 的 图 形 也 能 构造 出 高 颜 值 的 话 戏 , 越 是 简单 越 是 抽象 , 越 是 抽象 越 是 艺术 嘛 。 
Pygame 的 draw 模块 提供 了 绘制 简单 图 形 的 方法 ,支持 绘制 的 图 形 有 和 犯 形 、 多 边 形 、 圆 
形 、 椭 圆 形 、 弧 形 和 线条 。 


16.6.1 绘制 矩形 
绘制 矩形 的 语句 格式 如 下 : 


rect(Surface, color, Rect, width- 0) 


。 第 一 个 参数 指定 矩形 将 绘制 在 哪个 Surface XE Z8 E; 

。 第 二 个 参数 指定 颜色 ; 

。 第 三 个 参数 指定 矩形 的 范围 (eft, top, width, height); 

。 第 四 个 参数 指定 矩形 边框 的 大 小 (0 表示 填充 矩形 )，。 

rect() 方 法 用 于 在 Surface 对 象 上 边 绘 制 一 个 矩形 ,关于 最 后 一 个 参数 width ,看 下 面 的 例子 : 


X p16 6/pg_1.py 


WHITE = (255, 255, 255) 
BLACK = (0, 0, 0) 


pygame. draw. rect( screen, BLACK, (50, 50, 150, 50), 0) 
pygame. draw. rect( screen, BLACK, (250, 50, 150, 50), 1) 


pygame. draw. rect( screen, BLACK, (450, 50, 150, 50), 10) 


# 限制 每 秒 绘制 10 次 ,否则 CPU 会 跑 满 
clock. tick(10) 


程序 实现 如 图 16-20 所 示 . width Jy 0 表示 填充 整个 矩形 ,边框 是 向 外 延伸 的 。 
í FishC Demo 一 CERNI 
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图 16-20 ”绘制 矩形 
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16.6.2 绘制 多 边 形 
绘制 多 边 形 的 语句 格式 如 下 : 


polygon(Surface, color, pointlist, width- 0) 
polygon O ff] HE IR rect() 类 似 , 除 了 第 三 个 参数 不 同 ,polygon() 方 法 的 第 三 个 参数 接受 
由 多 边 形 各 个 顶点 坐标 组 成 的 列表 。 


# pl6 6/pg 2.py 


points - [(200, 75), (300, 25), (400, 75), (450, 25), (450, 125), (400, 75), (300, 125)] 


pygame. draw.polygon(screen, GREEN, points, 0) 


程序 实现 如 图 16-21 所 示 。 
Pe FishC Demo "Hsi x 


图 16-21 绘制 多 边 形 


16.6.3 绘制 圆 形 
绘制 圆 形 的 语句 格式 如 下 : 


circle(Surface, color, pos, radius, width- 0) 
第 一 、 二 \ 五 个 参数 跟前 面 的 两 个 方法 一 样 ,第 三 个 参数 指定 圆心 的 位 置 , 第 四 个 参数 指定 
半径 的 大 小 。 看 下 面 的 例子 : 


# p16 6/pg 3. py 


position = size[0]//2, size[1]//2 


moving - False 


for event in pygame. event. get( ) : 
if event. type == pygame. QUIT: 
sys. exit() 
if event. type == pygame. MOUSEBUTTONDOWN : 
if event. button == 
moving = True 
if event. type == pygame. MOUSEBUTTONUP: 


if event.button -- 
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moving = False 
if moving: 
position = pygame.mouse.get pos() 

screen. fill(WHITE) 

pygame. draw.circle(screen, RED, position, 25, 1) 

pygame. draw.circle(screen, GREEN, position, 75, 1) 

pygame. draw.circle(screen, BLUE, position, 125, 1) 

程序 实现 如 图 16-22 Birzn 
c FishC Demo — O0 


图 16-22 绘制 圆 形 


16.6.4 绘制 椭圆 形 
绘制 椭圆 形 的 语句 格式 如 下 ， 
ellipse(Surface, color, Rect, width = 0) 
椭圆 是 利用 第 三 个 参数 指定 的 矩形 来 绘制 的 ,所 以 你 的 限定 矩形 如 果 是 正方 形 ,那么 画 出 
来 的 就 是 一 个 圆 形 了 。 
# pl6 6/pg 4.py 
pygame. draw.ellipse(screen, BLACK, (100, 100, 440, 100), 1) 


pygame. draw.ellipse(screen, BLACK, (220, 50, 200, 200), 1) 


程序 实现 如 图 16-23 所 示 。 


16.6.5 绘制 弧 线 
绘制 弧 线 的 语句 格式 如 下 : 
arc(Surface, color, Rect, start angle, stop angle, width= 1) 
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16-23 ”绘制 椭圆 形 


arc() 方 法 是 绘制 椭圆 弧 , 也 就 绘制 椭圆 上 的 一 部 分 弧 线 ,因为 弧 线 并 不 是 全 包围 图 形 , 所 


以 不 能 将 width 设置 为 0 进行 填充 。 start angle 和 stop_angle 参数 用 于 设置 弧 线 的 起 始 角度 


# pl6 6/pg 5.py 


import math 


pygame. draw. arc(screen, BLACK, (100, 100, 440, 100), O0, math. pi, 1) 
pygame. draw.arc(screen, BLACK, (220, 50, 200, 200), math.pi, 2 * math.pi, 1) 


程序 实现 如 图 16-24 所 示 。 


G FishC Demo 一 口 一 
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图 16-24 ”绘制 弧 线 


16.6.6 绘制 线段 
绘制 线段 的 语句 格式 如 下 ; 
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line(Surface, color, start_pos, end_pos, width= 1) 

lines(Surface, color, closed, pointlist, width= 1) 

line() 用 于 绘制 一 条 线段 ,而 lines() 则 用 于 绘制 多 条 线段 。 其 中 ,lines() 方 法 的 closed & 
数 设置 是 否 首尾 相连 , 跟 polygon() 有 点 像 ,但 区 别 是 线段 不 能 通过 设置 width 参数 为 0 进行 


aaline(Surface, color, startpos, endpos, blend- 1) 
aalines(Surface, color, closed, pointlist, blend- 1) 


经 和 党 玩 游戏 的 读者 应 该 听 说 过 ”* 抗 锯齿 ”开局 抗 锯齿 后 画面 质量 会 有 质 的 飞跃 。 没 错 ， 
alineC) 和 aalines() 方 法 是 用 来 绘制 抗 锯 此 的 线段 ,aa 就 是 Mtr 抗 锯 齿 的 意思 。 最 后 
一 个 参数 blend 指定 是 否 通 过 绘制 混合 背景 的 阴影 来 实现 抗 锯齿 功能 。 由 于 没有 width 方 
法 ,所 以 它们 只 能 绘制 1 个 像素 的 线段 。 


# p16 6/pg 6. py 


pygame. draw. lines( screen, GREEN, 1, points, 1) 

pygame. draw.line(screen, BLACK, (100, 200), (540, 250), 1) 

pygame. draw.aaline(screen, BLACK, (100, 250), (540, 300), 1) 
pygame.draw.aaline(screen, BLACK, (100, 300), (540, 350), 0) 


程序 实现 如 图 16-25 所 示 。 
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图 16-25 ”绘制 线段 


截至 目前 ,我 们 已 经 学 了 Pygame 的 事件 、 图 片 的 转换 及 移动 .基本 的 图 形 绘制 、 透明 度 调 
整 等 内 容 , 但 距离 真正 实现 一 个 游戏 还 差 一 个 环节 : 碰撞 检测 。 在 讲 碰撞 检测 之 前 需要 引入 


一 个 新 的 知识 : 动画 精灵 
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Nonono ,不 是 说 蓝 精灵 。 我 们 说 的 动画 精灵 是 指 游戏 开发 中 ,那些 赋予 灵魂 的 事物 , 像 前 
边 的 小 乌 包 。 动 画 精 灵 的 实现 看 似 人 简单 ,实际 不 然 。 因 为 在 真正 的 游戏 开发 中 ,和 远 远 不 只 有 一 
个 精灵 ,它们 的 数量 随时 都 会 发 生变 化 (比如 说 敌人 不 断 地 出 现 , 然 后 不 断 地 被 消灭 ) ,它们 的 
移动 轨迹 也 并 不 是 一 样 的 ,既然 轨迹 不 同 , 那 么 肯定 就 会 发 生 碰 撞 , 所 以 精灵 还 要 文 持 磁 撞 检 
测 才 行 。 

下 边 将 通过 一 个 小 游戏 的 讲解 来 学 习 新 的 知识 ,同时 体验 一 个 游戏 开发 的 过 程 。 这 个 游 
戏 我 取 名 叫 PlayTheBall ,中文 名 大 概 叫 " 玩 个 球 啊 ”。 代 码 量 在 两 百 行 左右 ,但 其 中 涉及 碰撞 
检测 . 异 稼 处 理 . 计 时 天 、 目 定义 事件 、 播 放声 音 、 符 换 鼠 标 样 式 、 限 定 鼠 标 移 动 范围 等 新 的 知 
WA. 


游戏 界面 如 图 16-26 所 示 。 
1. 游戏 介绍 


游戏 的 背景 是 在 不 久 的 将 来 ,人 类 过 度 开 亮 ,地球 资源 不 断 枯 竭 …… 有 一 天 ,五 大 洲 上 出 
现 了 五 个 巨大 的 黑洞 正在 吞噬 地 球 ,地 球 危 在 旦 夕 …… 传 闻 只 要 集 齐 游 功 于 世界 各 地 的 金森 
水 火 土 五 颗 神 球 ,并 分 别 将 其 置 入 黑洞 中 ,就 可 以 抒 救 地 球 。 但 由 于 环境 污染 严重 ,五 个 神 球 
已 经 则 然 无 光 …… 所 以 ,我 们 需要 做 的 ,就 是 先 摩 探 摩 探 ! 


2. 游戏 说 明 


(1) 游戏 伴随 大麻 性 的 音乐 《我 的 滑板 鞋 》) 进 行 ,界面 上 出 现 五 个 随机 速度 的 灰色 小 球 ， 
它们 会 在 相互 碰撞 后 改变 原来 的 速度 。 
(2) 如 果 小 球 从 页 面 的 上 方 穿 过 ,会 从 下 方 出 现 , 同 样 , 如 果 小 球 从 左边 进入 会 从 右边 
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图 16-26  PlayTheBall 游戏 界面 


出 来 。 

(3) 鼠标 的 活动 范围 被 限定 在 下 方 的 玻璃 面板 上 ,通过 一 定 频 率 的 不 断 移动 鼠标 ,会 使 得 
相应 的 小 球 从 灰色 变 成 绿色 并 停止 移动 ,此 时 你 可 以 使 用 w、s、a、d 按键 分 别 上 下 左右 移动 
小 球 。 


(4) 当 玩 家 将 绿色 的 小 球 移动 到 育 景 中 黑洞 的 上 方 , 按 下 空格 键 会 检查 该 小 球 的 位 置 是 
否 完 全 履 次 黑洞 ,如果 是 的 话 , 小 球 将 被 固定 在 黑洞 中 ,此 后 其 他 球 将 忽略 它 ,直接 从 它 上 方 
SU. 

(5) T EE TE EIS Jt AULA BC ACH /]N ER HR R E Y. «dE XCTI] p 32 H 22] de Dj; 2 Hc ftl ER KS fi 
撞 , 因 为 一 旦 发 生 碰撞 ,绿色 的 小 球 就 会 马上 脱离 你 的 控制 ( 变 成 灰色 ), 并 重新 获得 随机 的 


速度 。 
(6) 在 歌曲 播 完 之 前 ,如 采 玩 家 能 把 所 有 的 小 球 都 成 功 地 固定 在 每 个 黑洞 中 , 诉 戏 胜利 。 


16.7.1 创建 精灵 

Pygame 的 sprite 模块 提供 了 一 个 动画 精灵 的 基 类 ,游戏 中 的 小 球 就 是 通过 继承 它 而 创建 
出 来 的 精灵 

# pl6 7/main.py 

import pygame 

import sys 


from pygame.locals import * 
from random import * 


class Ball(pygame.sprite.Sprite): # 球 类 继承 自 Spirte 类 
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def | init (self, image, position, speed): 
pygame. sprite. Sprite. init (self) # 初始 化 动画 精灵 
self.image = pygame. image. load(image).convert alpha() 
self.rect - self.image.get rect() 
self. rect. left, self. rect.top = position # 将 小 球 放 在 指定 位 置 
self.speed = speed 


def main(): 
pygame. init() 
ball image = "gray ball.png" 
bg image = "background. png" 
running - True 
bg size = width, height = 1024, 681 # 根据 背景 图 片 指定 游戏 界面 尺寸 
screen = pygame.display.set mode(bg size) 
pygame.display.set caption("Play the ball - FishC Demo") 
background = pygame. image.load(bg image).convert alpha() 
balls = [] # 用 来 存放 小 球 对 象 的 列表 


# 创建 五 个 小 球 
for i in range(5): 
# 位 置 随机 ,速度 随机 
position = randint(0, width- 100), randint(0, height - 100) 
speed = [randint( - 10, 10), randint( - 10, 10)] 
ball = Ball(ball image, position, speed) 
balls. append(ball) 


clock = pygame. time. Clock() 


while running: 
for event in pygame. event. get( ) : 
if event. type == QUIT: 
sys. exit() 
screen.blit(background, (0, 0)) 
for each in balls: 
screen.blit(each. image, each. rect) 
pygame. display. flip() 
clock. tick(30) 
if name  -- " main ": 
main() 


程序 实现 如 图 16-27 所 示 。 


16.7.2 移动 精灵 


接 下 来 让 小 球 动 起 来 ,事实 上 就 是 在 Ball 类 中 添加 move() 方 法 ,然后 在 绘制 每 个 小 球 前 
先 调用 一 次 move() 移 动 到 新 的 位 置 。 


def move(self): 
self. rect = self.rect.move(self.speed) 


e 299 。 


«il 


ES 
F 


基础 入 门 学 习 Python 


e Play the ball - FishC Demo 


图 16-27 创建 精灵 


for each in balls: 
each. move( ) 
screen.blit(each. image, each. rect) 


如 采 小 球 从 页 面 的 上 方 穿 过 ,会 从 下 方 出 现 , 同 样 ,如 条 小 球 从 左边 进入 会 从 右边 出 来 。 


class Ball(pygame. sprite.Sprite): 
# 增加 一 个 背景 尺寸 的 参数 
def | init (self, image, position, speed, bg size): 


self.width, self.height = bg size[0], bg size[1] 


def move(self): 
self.rect - self.rect.move(self.speed) 
# 如 果 小 球 的 右 侧 出 了 边界 ,那么 将 小 球 左 侧 的 位 置 改 为 右 侧 的 边界 
# 这 样 便 实 现 了 从 左边 进入 ,右边 出 来 的 效果 
if self. rect. right < 0: 
self. rect. left = self.width 
elif self. rect. left > self. width: 
self. rect. right = 0 
elif self. rect. bottom < 0: 
self. rect. top = self. height 
elif self. rect.top > self. height: 
self. rect. bottom = 0 


yt FE^ NERSLBE TE BERE A HFR EF. AE 16-28 所 示 。 
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图 16-28 ”移动 精灵 
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大 部 分 的 游戏 都 需要 做 碰撞 检测 ,比如 需要 知道 小 球 是 否 发 生 了 碰撞 ,子弹 是 否 击 中 了 目 
标 , 主 角 是 否 踩 到 了 地 雷 。 那 应 该 如 何 实 现 呢 ?其 实 原理 就 是 检查 两 个 精灵 之 间 是 否 存 在 重 
车 的 部 分 。 

16.8.1 尝试 自己 写 碰 撞 检测 水 数 


对 于 两 个 球 来 说 ,对 比 它 们 的 圆心 距离 和 半径 的 和 即 可 ,如 图 16-29 到 图 16-31 所 示 。 


width width width 
A —O t .———— —— —»- 


width > r1 + r2 width = r1 + r2 width « r1 + r2 


图 16-29 HARS 图 16-30 ” 相 切 状态 图 16-31 相交 状态 


下 面 是 一 个 检测 各 个 小 球 之 间 是 否 发 生 碰 撞 的 图 数 ,一旦 发 生 便 修 改 小 球 的 移动 方 回 : 
# p16 8/collide _ check. py 
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def collide check(item, target): 
col balls = [] 
for each in target: 


distance = math. sqrt(\ 
math. pow((item.rect.center[0] - each.rect.center[0]), 2) ^ 


+ math. pow( (item. rect. center[1] - each.rect.center[1]), 2)) 
if distance <= (item. rect. width + each. rect. width) / 2: 
col balls. append(each) 
return col balls 


# 先 让 所 有 小 球 移动 一 步 
for each in balls: 
each. move( ) 
screen.blit(each. image, each. rect) 
# 检测 各 个 小 球 之 间 是 否 发 生 碰撞 
for i in range(BALL NUM): 
# 先 将 要 检测 的 小 球 拿 出 来 
item = balls. pop(i) 
# 与 列表 中 的 其 他 小 球 一 一 对 比 
if collide check(item, balls): 
item.speed[0] = - item. speed[0] 
item.speed[1] = - item. speed[1] 
# 将 小 球 放 回 到 列表 中 
balls. insert(i, item) 


程序 成 功 地 实现 了 碰撞 检测 ,但 运气 不 大 好 的 时 候 ,会 出 现 小 球 卡 住 的 现象 ,如 图 16-32 


所 示 。 
m Play the ball - FishC Demo 


名 


图 16-32 小 球 卡 住 了 
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原因 是 : 当 小 球 在 诞生 的 位 置 恰好 有 其 他 小 球 , 因 此 检测 到 两 个 小 球 发 生 碰撞 ,速度 取 
反 , 但 如 果 两 个 小 球 相 互 尾 新 的 范围 大 于 移动 一 次 的 距离 , 屠 就 会 出 现 卡 住 的 现象 (反问 移动 
后 仍然 检测 到 碰撞 , 则 速度 取 反 ,又 变 成 相 问 移动 ,速度 不 变 的 情况 下 是 死 循 环 )。 

解决 方案 : 在 小 球 诞生 的 时 候 立 刻 检查 该 位 置 是 否 有 其 他 小 球 , 有 的 话 修 改 新 生 小 球 的 


# 创建 五 个 小 球 
BALL NUM = 5 
for i in range(BALL NUM): 
# 位 置 随机 ,速度 随机 
position = randint(0, width- 100), randint(0, height - 100) 
speed - [randint( - 10, 10), randint( - 10, 10)] 
ball = Ball(ball image, position, speed, bg size) 
# 测试 诞生 小 球 的 位 置 是 否 存在 其 他 小 球 
while collide check(ball, balls): 
ball. rect. left, ball.rect.top = randint(0, width- 100), V 
randint(0, height - 100) 
balls. append(ball) 


^ii collide check O R Zt H 38 FE F [3] 5j [3] [8] AS dif 88 Ro 9] , pn R E Hz fto o IE aX ASA 
则 图 形 ,那么 就 得 不 到 相应 的 效果 了 。 当 然 ,对 于 聪明 的 读者 朋友 来 说 ,为 每 一 种 特殊 情况 写 
一 个 检测 函数 也 并 不 是 不 可 以 。Pygame 的 sprite 模块 事实 上 已 经 提供 了 碰撞 检测 的 函数 供 
大 家 使 用 ,这 也 正 是 为 什么 我 们 的 类 要 继承 自 sprite 模块 的 Sprite 基 类 的 原因 。 


16.8.2 sprite 模块 提供 的 碰撞 检测 函数 


sprite 模块 提供 了 一 个 spritecollide() 函 数 , 用 于 检测 某 个 精灵 是 否 与 指定 组 中 的 其 他 精 


spritecollide(sprite, group, dokill, collided = None) 


。 第 一 个 参数 指定 被 检测 的 精灵 。 

。 第 二 个 参数 指定 一 个 组 ,由 sprite Group() 生 成 。 

。 第 三 个 参数 设置 是 否 从 组 中 删除 检测 到 碰撞 的 精灵 。 

。 第 四 个 参数 设置 一 个 回调 函数 ,用 于 定制 特殊 的 检测 方法 。 如 果 该 参数 忽略 ,那么 默 
认 是 检测 精灵 之 间 的 rect ENEEK. 


# p16 8/main.py 


# 用 来 存放 小 球 对 象 的 列表 
balls = [] 
group = pygame. sprite. Group( ) 
# 创建 五 个 小 球 
BALL NUM = 5 
for i in range(5): 
# 位 置 随机 ,速度 随机 
position = randint(0, width- 100), randint(0, height - 100) 
speed = [randint(- 1, 1), randint( - 1, 1)] 
ball = Ball(ball image, position, speed, bg size) 
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# 检测 新 诞生 的 球 是 否 会 卡 住 其 他 球 

while pygame. sprite. spritecollide(ball, group, False): 
ball. rect. left, ball.rect.top = randint(0, width- 100), \ 
randint(0, height - 100) 

balls. append(ball) 

group. add(ball) 


for each in balls: 

each. move( ) 

screen.blit(each. image, each. rect) 
for each in group: 


# 先 从 组 中 移出 当前 球 


group. remove( each) 


# 判断 当前 球 与 其 他 球 是 否 相 撞 

if pygame. sprite. spritecollide(each, group, False): 
each. speed[0] = - each. speed[ 0] 
each.speed[1] = - each. speed[1] 

# 将 当前 球 添 加 回 组 中 

group. add(each) 


结果 让 人 感到 诅 丧 …… 因 为 小 球 有 时 候 葛 然 在 没有 碰撞 的 情况 下 就 弹 开 了 …… 莫 非 现 成 的 
spritecollide() 还 不 如 我 们 自己 写 的 collide check O PR 7X 
精确 ? 

当然 不 是 ! 之 所 以 会 这 样 , 是 因为 上 面 的 代码 没 
有 设置 spritecollide() 图 数 的 第 四 个 。 默 认 这 个 参数 
是 None, 表 示 检 测 的 是 精灵 的 rect 属性 是 否 重 和 登 ,如 
图 16-33 所 示 。 

如 果 是 如 图 16-33 所 示 的 情况 ,由 于 小 球 的 背景 
是 透明 的 ,所 以 看 上 去 就 好 像 没 有 发 生 碰 撞 就 弹 开 了 
(其 实 对 应 的 rect 已 经 是 重 毒 了 ) 。 因 此 ,需要 实现 圆 
形 的 碰撞 检测 ,还 需要 指定 spritecollide O) PR ZI ff dac 16-33 sprite 模块 提供 的 碰撞 检测 函数 
后 一 个 参数 。 


16.8.3 实现 完美 碰撞 检测 


spritecollide() 函 数 的 最 后 一 个 参数 是 指定 一 个 回调 函数 ,用 于 定制 特殊 的 检测 方法 。 而 
sprite 模块 中 正好 有 一 个 collide_circle() 函 数 用 于 检测 两 个 加 之 间 是 否 发 生 碰撞 。 注 意 : 这 
个 函数 需要 精灵 对 象 中 必须 有 一 个 radius( 半 径 ) 属 性 才 行 。 


# p16 8/main.py 
class Ball(pygame. sprite.Sprite): 


self.radius = self.rect.width / 2 
BALL NUM - 5 
for i in range(BALL NUM): 

£o 位 置 随机 ,速度 随机 


position = randint(0, width- 100), randint(0, height - 100) 
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speed = [randint( - 1, 1), randint( - 1, 1)] 

ball = Ball(ball image, position, speed, bg size) 

# 检测 新 诞生 的 球 是 否 会 卡 住 其 他 球 

while pygame. sprite. spritecollide(ball, group, False, \ 

collide circle): 
ball. rect. left, ball.rect.top = randint(0, width- 100), \ 
randint(0, height - 100) 

balls. append(ball) 

group. add( ball) 


for each in group: 
# 先 从 组 中 移出 当前 球 
group. remove( each) 
# 判断 当前 球 与 其 他 球 是 否 相 撞 
if pygame. sprite. spritecollide(each, group, False, \ 
collide circle): 
each.speed[0] = - each. speed[0] 
each. speed[1] = - each. speed[1] 
# 将 当前 球 添 加 回 组 中 
group. add(each) 


16.9 播放 声音 和 音效 


[n] 7 34 

JLP 38 FE fi] Ui 4: — F8 ARCET] « DAL Ze RR ER PIS E e RI CDU AR HU TRES. DU Pr 
AI Jj XX, SC AT EE Af RE E 1 EARS oes lo ab FO EE] i, E IRAE AE , Pygame 对 于 声音 的 处 理 
并 不 是 特别 擅长 ,我 说 的 是 如 果 你 想 用 Pygame 来 做 一 个 炫 酷 的 音乐 播放 需 的 话 可 能 不 行 , 因 
为 Pygame 对 声音 格式 的 文 持 十 分 有 限 。 不 过 对 于 游戏 开发 来 说 ,是 完全 足够 的 。 

对 于 一 般 游 戏 来 说 ,声音 分 为 背景 音乐 和 音效 两 种 。 背 景 音 乐 是 时 刻 伴 随 春 游戏 存在 的 ， 
往往 是 重复 播放 的 一 首 歌 或 曲子 ; 而 音效 则 是 在 某 种 条 件 下 被 触发 产生 的 ,例如 两 个 小 球 碰 
撞 就 会 发 出 啦 啦 哺 的 声音 。Pygame 文 持 的 声音 格式 十 分 有 限 ,所 以 一 般 情况 下 用 ogg 格式 
作为 背景 音乐 ,用 无 压缩 的 wav 格式 作为 音效 。 

播放 音效 使 用 mixer 模块 ,需要 先生 成 一 个 Sound 对 象 , 然 后 调用 play() 方 法 来 播放 。 
表 16-4 列举 了 Sound 对 象 支持 的 方法 。 


X 16-4 Sound 对象 支 持 的 方法 


方 法 * 义 
play() 播放 音效 
stop() 停止 播放 
fadeout() 淡出 
set volume() 设置 音量 
get_volume() 获取 音量 
get_num_channels() 计算 该 音效 播放 了 多 少 次 
get length() 获得 该 音效 的 长 度 
get_raw() 将 该 音效 以 二 进 制 格式 的 字符 串 返 回 
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播放 背景 音乐 使 用 music 模块 , music 模块 是 mixer 模块 中 的 一 个 特殊 实现 ,因此 使 用 
pygame. mixer. music 来 调用 该 模块 下 的 方法 。 表 16-5 列举 了 music 模块 支持 的 方法 。 
表 16-5 music 模块 支持 的 方法 
方法 人 x 

bdO | AW —— ”|gct_volume() | 获取 音量 

payo ”| 0 GÉHGOR ” ” |get_busy() — [EUNHERUUE GE TEMOR 

rwidO | 重新 播放 [senposO | 设置 开始 播放 的 位 置 

s0 | 停止 播放 ” ”|getposO | 获取 已 经 播放 的 时 间 

pause() 将 音乐 文件 放 入 待 播放 列表 中 

unpause() 在 音乐 播放 完毕 时 发 送 事件 

fadeout() 获取 音乐 播放 完毕 时 发 送 的 事件 类 型 
stvoumeO | 设置 音量 | 


下 面 编 写 代 码 , 要 求 打开 程序 便 开 始 播放 背景 音乐 (bg_mnusic. ogg) , 单 击 播放 cat. wav 音 
效 , 通 过 右键 快捷 菜单 可 播放 dog. wav, 利 用 空格 键 可 暂停 /继续 播放 音乐 。 


# p16 9/music.py 

import pygame 

import sys 

from pygame. locals import * 


pygame. init() 

pygame. mixer. init() # 初始 化 混 音 器 模块 

# 加 载 背 景 音乐 

pygame. mixer. music. load("bg music. ogg") 

pygame. mixer. music. set volume(0.2) 

pygame. mixer. music. play() 

# 加 载 音效 

cat sound = pygame. mixer.Sound("cat. wav") 

cat sound.set volume(0.2) 

dog sound = pygame. mixer. Sound(" dog. wav") 

dog sound.set volume(0.2) 

bg size = width, height = 300, 200 

Screen = pygame.display.set mode(bg size) 

pygame.display.set caption("Music - FishC Demo") 

pause - False 

pause image = pygame. image. load("pause. png"). convert alpha() 
unpause image = pygame. image. load("unpause. png"). convert alpha() 
pause rect - pause image.get rect() 

pause rect.left, pause rect.top = (width - pause rect.width) // 2, \ 
(height - pause rect. height) // 2 

clock = pygame.time.Clock() 


while True: 
for event in pygame. event. get() : 

if event. type == QUIT: 
sys. exit() 

if event. type == MOUSEBUTTONDOWN: 
if event.button -- 

cat sound. play() 

if event.button -- 
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dog sound. play() 
if event. type == KEYDOWN: 
if event. key == K SPACE: 
pause - not pause 
screen. fill((255, 255, 255)) 
if pause: 
screen.blit(pause image, pause rect) 
pygame. mixer. music. pause() 
else: 
screen. blit(unpause_image, pause_rect) 
pygame. mixer. music. unpause() 


pygame. display. flip() 
clock. tick(30) 


上 面 的 代码 演示 了 背景 声音 和 音效 的 使 用 ,现在 把 声音 添加 到 我 们 的 游戏 中 : 
# pl6 9/main.py 


running - True 
# 添加 魔 性 的 背景 音乐 
pygame. mixer. music. load( bg music. ogg) 

pygame. mixer.music.play() 
# 添加 音效 
loser sound = pygame. mixer. Sound( loser. wav') 
laugh sound = pygame. mixer. Sound( laugh. wav ') 
winner sound = pygame.mixer.Sound( winner. wav') 
hole sound = pygame. mixer. Sound( 'hole. wav') 


音效 只 要 在 需要 的 时 候 调 用 play() 方 法 即 可 ,而 背景 音乐 我 们 则 和 希望 它 能 够 贯穿 游戏 的 
始终 。 背 景 音乐 完整 播放 一 次 视 为 游戏 的 时 间 , 因 此 需要 想 办 法 让 游戏 在 背景 音乐 停止 时 结 
束 。 大 家 应 该 有 留意 到 music 模块 有 一 个 set_endevent() 方 法 ,该 方法 的 作用 就 是 在 音乐 播 
放 完 发 送 一 条 事件 消息 。 

Pygame 预定 义 了 很 多 默认 的 事件 , 像 我 们 熟悉 的 键盘 事件 .鼠标 事件 等 。 预 定义 的 事件 
都 有 一 个 标识 符 , 像 MOUSEBUTTONDOWN,KEYDOWN,QUIT 等 。 其 实 这 些 都 是 一 些 
数字 的 等 值 定 义 , 只 是 为 了 方便 人 类 理解 才 做 的 定义 。USEREVENT 以 上 则 是 让 我 们 上 自 定 
义 的 事件 ,因此 可 以 像 这 样 自 定义 事件 : 

MYEVENT1 = USEREVENT 


MYEVENT2 = USEREVENT + 1 
MYEVENT3 = USEREVENT + 2 


下 面 的 代码 让 背景 音乐 播 完 的 时 候 游 戏 结束 ,并 播放 “失败 者 ”(loser. wav) 及“ 嘲笑” 
(laugh. wav) 的 音效 : 


# p16 9/main.py 


H 音乐 放 完 时 游戏 结束 ! 
GAMEOVER = USEREVENT 
pygame.mixer.music.set endevent(GAMEOVER) 
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for event in pygame. event. get( ): 

if event.type -- QUIT: 
sys. exit() 

elif event.type -- GAMEOVER: 
loser sound. play() 
pygame. time. delay(2000) 
laugh sound. play() 
running - False 


46.10 ”响应 鼠标 
"7 


16.10.1 -设置 鼠标 的 位 置 


有 了 背景 音乐 有 了 小 球 ` 有 了 碰撞 检测 , 接 下 来 需要 做 的 就 是 设计 “摩擦 摩擦 ”的 代码 了 。 
这 有 一 块 玻璃 面板 的 图 片 ,如 图 16-34 所 示 。 


e o 


i e 
iu NNNM Pi 
图 16-34 游戏 素材 


把 它 放 在 游戏 界面 的 下 方位 置 ,并 限制 鼠标 只 能 在 里 边 移动 。 一 步 一 步 来 , 先 创 建 一 个 
Glass 类 ,用 于 表示 这 块 玻璃 : 


class Glass( pygame. sprite. Sprite) : 
def __init__(self, glass image, bg size): 
pygame.sprite.Sprite. init (self) 
self.glass image = pygame. image.load(glass image).convert alpha() 
self.glass rect - self.glass image.get rect() 
self.glass rect.left, self.glass rect.top = V 
(bg size[0] - self.glass rect.width) // 2, \ 


e 308 * 


第 了 6 £ Pygame. 游戏 开发 |» 


bg size[1] - self.glass rect. height 


* 生成 用 于 摩擦 摩擦 的 玻璃 面板 


area = Glass(glass image, bg size) 


screen.blit(background, (0, 0)) 
# 绘制 用 于 摩擦 摩擦 的 玻璃 面板 


screen. blit(area. glass image, area.glass rect) 


代码 实现 如 图 16-35 所 示 。 


is Play the ball - FishC Demo DE 


图 16-35 ”游戏 界面 


下 一 步 是 限制 鼠标 只 能 在 玻璃 面板 中 移动 ,并 使 用 一 个 小 手 的 图 案 代 督 原来 的 鼠标 光标 
等 ,你 说 限制 鼠标 移动 ? 说 的 容易 ,鼠标 怎么 移动 是 玩家 的 事 ,我 还 能 干预 它 ? 

当然 可 以 ,程序 是 你 与 的 ,在 你 的 地 盘 上 当然 是 你 做 主 ! 可 以 先 通 过 mouse 模块 的 get_ 
pos() 方 法 获取 鼠标 的 当前 位 置 , 检 测 如 果 超 出 了 玻璃 面板 的 范围 , 则 使 用 set_pos() 修 改 它 。 


16.10.2 自 定 义 鼠 标 光 标 


作为 一 个 游戏 ,当然 希望 鼠标 的 光标 可 以 更 漂亮 一 些 , 所 以 需要 替换 掉 原 来 "黑土 小 ?的 科 
头 光 标 。 这 里 直接 用 一 个 小 手 的 图 片 来 替换 掉 原 来 的 光标 。 做 法 就 是 使 用 mouse 模块 的 set_ 
visible() 方 法 将 原来 的 光标 设置 为 “不 可 见 ”, 然 后 在 鼠标 的 当前 位 置 上 绘制 小 手 的 图 片 。 

代码 实现 如 下 : 


class Glass(pygame. sprite. Sprite): 
def init (self, glass image, mouse image, bg size): 
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self.mouse image = pygame.image.load(mouse image).convert alpha() 
self.mouse rect - self.mouse image.get rect() 

self.mouse rect.left, self.mouse rect.top = V 

self.glass rect.left, self.glass rect.top 

# 初始 化 鼠标 的 位 置 于 左上 角 

pygame.mouse.set pos([self.glass rect.left, self.glass rect.top]) 
# 鼠标 不 可 见 


pygame.mouse.set visible(False) 


screen.blit(background, (0, 0)) 
screen.blit(area.glass image, area.glass rect) 
# 获取 鼠标 的 当前 位 置 ,并 设置 代替 光标 的 图 片 
area.mouse rect.left, area.mouse rect.top = pygame.mouse.get pos() 
# 限制 鼠标 只 能 在 玻璃 内 摩擦 摩擦 
if area. mouse rect. left < area. glass rect. left: 
area. mouse rect. left = area.glass rect. left 
if area.mouse rect. left > area. glass rect.right - \ 
area.mouse rect.width: 
area.mouse rect.left = area.glass rect.right - V 
area.mouse rect. width 
if area.mouse rect. top < area.glass rect. top: 
area.mouse rect.top - area.glass rect.top 
if area.mouse rect. top > area.glass rect.bottom - V 
area.mouse rect. height: 
area.mouse rect.top = area.glass rect.bottom - V 
area.mouse rect. height 
screen.blit(area.mouse image, area.mouse rect) 


代码 实现 如 图 16-36 所 示 。 
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图 16-36 替换 掉 原 来 的 鼠标 
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16.10.3 让 小 球 响 应 光标 的 移动 频率 


接 下 来 要 让 小 球 可 以 啊 应 鼠标 的 “摩擦 ”, 当 鼠标 的 移送 速度 符合 某 个 频率 段 时 ,小 球 将 停 
下 来 并 变 成 绿色 。 

大 家 知道 鼠标 的 移动 会 不 断 产生 事件 ,所 以 可 以 利用 这 一 点 ,让 每 一 个 小 球 响 应 1 秒 钟 时 
间 内 不 同 数量 的 事件 。 

做 法 如 下 : 

CD 为 每 个 小 球 设 定 一 个 不 同 的 目标 ; 

(2) 创建 一 个 motion 变量 来 记录 鼠标 每 1 秒 钟 产生 事件 数量 ; 

(3) 为 小 球 添 加 一 个 check() 方 法 ,用 于 判断 鼠标 在 1 秒 钟 时 间 内 产生 的 事件 数量 是 否 匹 
配 此 目标 ; 

(4) 添加 一 个 目 定 义 事件 ,每 1 秒 钟 触发 1 次 。 调 用 每 个 小 球 的 check() 检 测 是 motion 
的 值 是 否 匹 配 某 一 个 小 球 的 目标 ,并 将 motion 重新 初始 化 ,以 便 记 录 下 1 秒 的 鼠标 事件 
数量 s 

(5) 小 球 应 该 添加 一 个 control 属性 ,用 于 记录 当前 的 状态 (绿色 -二 玩家 控制 or 灰色 -二 
随机 移动 ); 

(6) 通过 检查 control 属性 决定 绘制 什么 颜色 的 小 球 。 

代码 实现 如 下 : 


# p16 10/main.py 
class Ball(pygame. sprite.Sprite): 
def init (self, grayball image, greenball image, position, \ 
speed, bg size, target): 
* 初始 化 动画 精灵 
pygame. sprite. Sprite. init (self) 
self.grayball image = V 
pygame. image. load(grayball image).convert alpha() 
self.greenball image = V 
pygame. image.load(greenball image).convert alpha() 
self.rect = self.grayball image.get rect() 
# 将 小 球 放 在 指定 位 置 
self.rect.left, self.rect.top = position 
self.radius = self.rect.width / 2 
self.width, self.height = bg size[0], bg size[1] 
self.speed = speed 
self.target - target 


self.control = False 


def check(self, motion): 
# ZOR 100 % 匹配 是 很 难 的 ,所 以 还 是 降低 点 难度 吧 
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if self. target < motion < self.target + 5: 


return True 
else: 


return False 


# 创建 五 个 小 球 
BALL NUM = 5 
for i in range(BALL NUM): 


# 位 置 随机 ,速度 随机 
position = randint(0, width- 100), randint(0, height - 100) 


speed - [randint( - 10, 10), randint( - 10, 10)] 
ball = Ball(grayball image, greenball image, position, V 
speed, bg size, 5 * (i-*1)) 


# 生成 用 于 摩擦 摩擦 的 玻璃 面板 
area = Glass(glass image, mouse image, bg size) 
# motion 记录 鼠标 在 玻璃 面板 产生 的 事件 数量 
motion = 0 
# 1 秒 检查 一 次 摩擦 摩擦 
MYTIMER = USEREVENT + 1 
pygame. time. set_timer(MYTIMER, 1000) 
clock = pygame. time. Clock() 


for event in pygame. event. get() : 


elif event.type == MOUSEMOTION: 


motion += 1 


elif event.type -- MYTIMER: 
if motion: 
for each in group: 
if each. check(motion): 
each. speed = [0, 0] 
each.control - True 


motion = 0 


for each in balls: 
each. move( ) 


if each. control: 
screen.blit(each.greenball image, each. rect) 


else: 
screen.blit(each.grayball image, each.rect) 


程序 实现 如 图 16-37 所 示 。 
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图 16-37 ”让 小 球 响应 光标 的 移动 频率 


46.11 ”响应 键盘 


通过 “ 摩 所 摩擦 ”可 以 使 小 球 变 绿色 ,玩家 此 时 可 以 通过 键盘 上 的 W.S.A.D 按键 上 下 左 


右 地 移动 小 球 。 下 边 代 码 啊 应 相应 的 键盘 事件 : 


elif event. type == KEYDOWN: 
if event. key == K w: 
for each in group: 
if each. control: 
each. Speed[1] -= 1 
if event. key == K s: 
for each in group: 
if each. control: 
each.speed[1] += 1 
if event.key == K a: 
for each in group: 
if each. control: 
each. speed[0] -= 1 
if event. key == Kd: 
for each in group: 
if each. control: 
each. speed[0] += 1 


程序 执行 后 ,无 论 玩 家 是 短暂 地 按 下 按键 还 是 持续 紧 按 ,结果 都 只 是 让 小 球 以 怨 速 移动 ， 
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并 没有 实现 所 谓 “ 带 加 速度 的 快感 "。 这 是 由 于 上 默认 情况 下 ,无 论 你 是 简单 的 按 一 下 按键 还 是 
紧 按 着 不 松 开 ,Pygame 都 只 为 你 发 送 一 个 键盘 按 下 的 事件 。 不 过 事实 上 可 以 通过 key 模块 
的 set_repeat() 方 法 ,来 设置 是 否 重 复 啊 应 持续 按 下 某 个 按键 。 


set repeat(delay, interval) 


* delay 参数 指定 第 一 次 发 送 事件 的 延迟 时 间 
。 interval 参数 指定 重复 发 送 事件 的 时 间 间 陋 
。 如 果 不 带 任何 参数 ,表示 取消 重复 发 送 事件 
为 了 使 得 小 球 获得 加 速度 的 快感 ,设置 按键 的 重复 响应 间隔 为 100 上 毫秒: 


# 设置 持续 按 下 键盘 的 重复 啊 应 
pygame.key.set repeat(100, 100) 


小 球 在 碰撞 后 失去 控制 ,只 需要 在 检测 到 碰撞 时 将 control 属性 改 为 False, 小 球 即 脱离 控制 : 


if pygame. sprite. spritecollide(each, group, False, V 
pygame. sprite.collide circle): 

each.speed[0] = - each. speed[ 0] 

each.speed[1] = - each. speed[1] 

each.control - False 


16.12 结束 游戏 


` 
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撞 的 时 候 获 得 一 个 新 的 随机 速度 ,这 将 加 大 游戏 的 难度 。 


for each in group: 

# 先 从 组 中 移出 当前 球 

group. remove( each) 

# 判断 当前 球 与 其 他 球 是 否 相 撞 

if pygame. sprite. spritecollide(each, group, False, \ 

pygame. sprite.collide circle): 
each. speed = [randint( - 10, 10), randint( - 10, 10)] 
each.control - False 

# 将 当前 球 添 加 回 组 中 

group. add( each) 


但 是 程序 实现 后 …… 意 想不到 的 事情 发 生 了 ,如 图 16-38 所 示 。 
两 个 小 球 碰撞 的 时 候 经 常会 发 生 “ 拌 动 ”* 现 象 ,浪漫 的 读者 朋友 看 到 的 可 能 是 俩 小 球 如 胶 
似 漆 ,彼此 不 愿 分 开 的 缠绵 …… 而 事实 上 更 多 玩家 看 到 的 则 是 : 这 游戏 怎么 这 么 卡 ? 
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图 16-38 出现 bug 


16.12.2 -减少 "抖动 "现象 的 发 生 


分 析 一 下 出 现 “ 拌 动 2 的 原因 ,无 非 就 是 每 次 碰撞 都 获得 一 个 随机 的 速度 导致 。 由 于 随机 
的 速度 带 有 方 回 (负数 往 左 , 正 数 往 右 ) ,所 以 如 果 两 个 小 球 刚 好 得 到 的 速度 方 回 是 相 回 的 , 那 
么 就 会 再 次 发 生 碰 撞 ,直到 速度 方 癌 为 反 回 ,并且 一 次 移动 的 距离 可 以 彼此 分 开 为 止 。 

解决 这 个 问题 的 方法 就 是 将 方 句 和 速度 两 个 概念 独立 开 来 ,因此 为 小 球 添加 一 个 side 属 
性 用 于 表示 方 癌 ,一 1 表示 问 左 ,1 表示 问 右 。 人 然后 在 每 次 检测 到 碰撞 的 时 候 先 将 方 铝 取 反 ,以 
相同 的 速度 反问 移动 一 次 后 ,上 骨 重 新 获取 随机 速度 。 

先 给 小 球 添 加 一 个 side 属性 和 一 个 collide 属性 ,collide 属性 用 于 标志 是 否 发 生 碰 撞 , 如 
采 发 生 碰撞 ,再 下 一 次 的 移动 后 获得 随机 速度 : 

class Ball(pygame. sprite.Sprite): 

def init (self, imagel, image2, position, speed, bg size, level): 


self. side = [choice([ - 1, 1]), choice([ - 1, 1])] 


self.collide = False 
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个 属性 相 乘 得 到 : 


class Ball(pygame. sprite.Sprite): 


def move(self): 


self.rect - self.rect.move((self.side[0] * self.speed[0], ^ 
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self.side[1] * self.speed[1])) 
由 于 速度 不 再 表示 方向 ,所 以 随机 速度 不 应 该 存在 负数 : 


BALL NUM = 5 

for i in range(BALL NUM): 
# 位 置 随机 ,速度 随机 
position = randint(0, width- 100), randint(0, height - 100) 
speed = [randint(1, 10), randint(1, 10)] 


碰撞 发 生 时 ,首先 修改 的 是 方 问 : 


if pygame. sprite. spritecollide(each, group, False, \ 
pygame.sprite.collide circle): 

each.side[0] = - each. side[0] 

each. side[1] — each. side[1] 


each. collide True 


each. control False 


进行 一 次 移动 后 再 获取 随机 速度 : 


for each in balls: 
each. move( ) 
if each. collide: 
each. speed = [randint(1, 10), randint(1, 10)] 
each.collide - False 


程序 运行 后 新 的 BUG 又 出 现 了 ,控制 权 交 到 玩家 手 上 时 ,小 球 并 不 能 正确 地 按照 玩家 的 
操作 去 移动 …… 现 实 中 的 开发 常常 会 碰 到 这 样 的 情景 , 补 完 一 个 BUG 或 新 添加 一 个 功能 , 直 
接 影响 了 原来 正确 的 代码 逻辑 ,导致 男 一 个 BUG 的 出 现 。 

为 什么 会 导致 玩家 的 操作 无 法 正确 地 控制 小 球 呢 ? 人 和 仔细 检查 代码 之 后 发 现 原来 将 带 方 问 
的 速度 拆 分 为 方 铝 和 速度 ,而 响应 玩家 按键 操作 的 代码 仍旧 认为 速度 是 带 方 回 的 (如 果 速 度 为 
负数 , 方 问 为 负数 ,那么 得 到 的 却 是 反方 向 的 移动 ) 。 

为 了 保留 玩家 操控 小 球 是 带 加 速度 的 这 一 特性 ,不 妨 将 小 球 的 移动 给 区 分 开 : 


def move(self): 
if self.control: 
self.rect = self.rect.move(self. speed) 
else: 
self.rect = self.rect.move( \ 
(self.side[0] * self.speed[0], self.side[1] * self.speed[1])) 
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if pygame. sprite. spritecollide(each, group, False, V 
pygame. sprite.collide circle): 
each.side[0] = - each. side[0] 
each.side[1] = - each. side[1] 
each.collide - True 
if each. control: 
each. side[0] 
each. side[1] 
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each.control = False 


这 么 改 完 之 后 发 现 拌 动 的 现象 有 了 显著 减少 ,只 是 偶尔 两 个 小 球 会 卡 在 边框 之 外 。 所 以 
这 里 再 修改 一 下 move() 限 制 边界 的 范围 : 


def move( self): 
if self.control: 
self.rect - self.rect.move(self.speed) 
else: 
self.rect = self.rect.move( \ 
(self.side[0] * self.speed[0], self.side[1] * self.speed[1])) 
# 如 果 小 球 的 左 侧 出 了 边界 ,那么 将 小 球 左 侧 的 位 置 改 为 右 侧 的 边界 
# 这 样 便 实 现 了 从 左边 进入 ,右边 出 来 的 效果 
if self.rect.right < 0: 
self.rect.left = self.width 
elif self. rect. left > self.width: 
self. rect. right = 0 
elif self. rect. bottom < 0: 
self. rect.top = self. height 
elif self. rect. top > self. height: 
self. rect. bottom = 0 


16.12.3 游戏 胜利 


当 绿 色 的 小 球 移动 到 黑洞 的 正 上 方 时 ,只 要 玩家 立刻 殴 下 键盘 的 空格 键 , 那 么 小 球 将 被 
“ 填 ?” 入 到 黑洞 中 。 此 后 其 他 小 球 将 直接 从 其 上 方 球 过 ,无视 它 的 存在 。 音 乐 结束 前 ,如果 所 有 
的 小 球 都 被 十 入 到 各 个 黑洞 中 ,游戏 胜利 。 

这 里 有 两 点 需要 注意 : 第 一 是 每 个 黑洞 只 能 填 入 一 个 绿色 的 小 球 ; 第 二 是 当 小 球 填 入 黑 
洞 时 ,其 他 小 球 会 从 其 上 方 冉 过 ,而 不 是 下 方 。 

自 先 ,将 五 个 黑洞 的 位 置 定义 好 : 

# 五 个 黑洞 的 范围 ,因为 100% 命 中 太 难 ,所 以 只 要 在 范围 内 即 可 


# 每 个 元 素 : (xl, x2, yl, y2) 
hole = [(117, 119, 199, 201), (225, 227, 390, 392), (503, 505, 320, 322), (698, 700, 192, 194), 


(906, 908, 419, 421)] 


当 玩 家 按 下 空格 键 时 ,检测 每 个 小 球 的 当前 位 置 是 否 匹配 任何 一 个 黑洞 的 范围 ,如 有 果 是 ， 
那么 国定 它 。 如 果 所 有 的 黑洞 都 被 补 上 ,游戏 胜利 : 
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if event.key -- K SPACE: 
# 判断 小 球 是 否 在 坑内 
for each in group: 
if each. moving: 
for i in hole: 
if i[0] <= each.rect.left <= i[1] and i[2] V 
<= each.rect.top «7» i[3]: 
# 播放 音效 
hole sound. play() 
each. speed = [0, 0] 
# 从 group 中 移出 ,这 样 其 他 球 就 会 忽视 它 
group. remove( each) 
# 放 到 balls 列表 中 的 最 前 ,也 就 是 第 一 个 绘制 的 球 
# 这 样 当 球 在 坑 里 时 ,其 他 球 会 从 它 上 边 过 去 ,而 不 是 下 边 
temp = balls. pop(balls. index(each)) 
balls.insert(0, temp) 
# 一 个 坑 一 个 球 
hole. remove( i) 
H 坑 都 补 完 了 ,游戏 结束 
if not hole: 
pygame. mixer. music. stop() 
# 播放 胜利 配乐 
winner sound. play() 
pygame. time. delay(3000) 
* TERZA BB 
msg = pygame. image. load("win.png").convert alpha() 
msg pos = (width - msg.get width()) //2, \ 
(height - msg.get height()) // 2 
msgs.append((msg, msg pos)) 
# 播放 嘲笑 
laugh sound. play() 


16.12.4 更 好 地 结束 游戏 


为 了 在 IDLE 下 单 击 关 闭 按钮 可 以 正常 结束 游戏 ,可 以 在 响应 QUIT 事件 的 时 候 先 调用 
pygame. quit() : 


if event. type == QUIT: 
pygane. quit() 
sys.exit() 


4n JH P Gb FTF DERRI SC ^F 39 A n RU 3E EC V Son TUR B V ,程序 可 能 就 会 直接 关 
闭 。 这 样 对 于 调试 也 是 不 利 的 ,因此 可 以 这 么 改 : 


if name  -- " main ": 
# 这 样 做 的 好 处 是 双击 打开 时 如 果 出 现 异常 可 以 报告 异常 ,而 不 是 一 内 而 过 ! 
ETEY: 
main() 
except SystemExit: 
pass 
except: 
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traceback.print exc() 

# 释放 已 经 初始 化 的 资源 
pygame. quit() 

input() 


完整 实现 代码 见 附件 PI6 11, 


te. 13 经 典 飞机 大 战 
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心 是 被 震撼 到 的 。 第 一 次 接触 打 飞 机 的 时 候 作 者 本 人 是 身心 愉悦 的 ,因为 周边 的 朋友 都 在 打 
飞机 ,每 次 都 会 下 意识 彼此 较量 一 下 ,看 谁 打 得 更 好 。 打 飞机 也 是 需要 有 一 定 的 技巧 的 ,熟练 
的 朋友 一 把 能 打上 半 个 小 时 , 生 朴 的 则 三 五 分 钟 就 败 下 阵 来 。 

16. 13.1 - 游戏 设 定 


游戏 界面 如 图 16-39 一 图 16-41 所 示 。 
游戏 的 基本 设 定 : 


政 方 共有 大 中 小 3 球 飞 机 ,分 为 高 中 低 三 种 时 于 E05 


速度 ; 

子弹 的 射程 并 非 全 屏 ,而 大 概 是 屏幕 长 度 的 
8074 ; 

消灭 小 飞机 需要 1 发 子弹 ,中 飞机 需要 8 
发 ,大 飞机 需要 20 发 子弹 ; 

每 消灭 一 架 小 飞机 得 1000 分 ,中 飞机 6000 
分 ,大 飞机 10000 分 ; 

fà 30 秒 有 一 个 随机 的 道具 补给 ,分 为 两 
种 道具 ,全 屏 炸 弹 和 双 倍 子弹 ; 

全 屏 炸 弹 最 多 只 能 存放 3 枚 , 双 倍 子弹 可 以 
维持 18 秒 钟 的 效果 ; 

游戏 将 根据 分 数 来 逐步 提高 难度 ,难度 的 提 
高 表现 为 飞机 数量 的 增多 以 及 速度 的 加 快 。 


男 外 还 对 游戏 做 了 一 些 改进 ,比如 为 中 飞机 和 
大 飞机 增加 了 血 模 的 显示 ,这 样 玩家 可 以 直观 地 知 
道 敌 机 快 被 消灭 了 没有 ; 我 方 有 三 次 机 会 ,每 次 被 
敌人 消灭 ,新 诞生 的 飞机 会 有 3 秒 钟 的 安全 期 ; Uf 
戏 结束 后 会 显示 历史 最 高 分 数 。 

这 个 游戏 加 上 基本 的 注释 代码 量 在 800 行 左右 ,代码 看 上 去 比较 多 ,主要 是 作者 本 人 奉行 
着 “多 大 代码 少 动脑 ”的 开发 原则 。 所 以 大 家 不 要 怕 , 越 是 多 的 代码 ,人 逻辑 就 越 容易 看 得 清楚 ， 
就 越 好 学 习 。 好 , 那 让 我 们 从 无 到 有 ,从 简单 到 复杂 来 一 起 打造 这 个 游戏 吧 ! 完整 代码 及 资源 
可 参考 附件 : pl6 13. 
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图 16-39 打 飞 机 游戏 (一 ) 
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重新 开始 
结束 游戏 


16-40 打 飞 机 游戏 (二 ) 16-41 打 飞 机 游戏 (三 ) 


首先 ,把 能 够 独立 开 的 代码 独立 成 模块 : 
* main. py 一 一 主 模块 。 

。 myplane. py 一 一 定义 我 方 飞 机 。 

* enemy. py 一 一 定义 敌 方 飞机 。 

* bullet. py 一 一 定义 子弹 。 

* supply. py 一 一 定义 补给 。 

资源 文件 分 类 存放 : 

* sound 一 一 声音 、 音 效 资 源 。 

* images 图 片 资 源 。 

* font 一 一 字体 资源 。 


16.13.2 FRH 
先 写 主 模块 的 代码 ; 


# main.py 

import pygame 

import sys 

import traceback 

import myplane 

import bullet 

import enemy 

import supply 

from pygame.locals import * 
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from random import * 


pygame. init() 

pygame. mixer. init() 

bg size = width, height = 480, 700 

Screen = pygame.display.set mode(bg size) 

pygame. display. set_caption(" 飞 机 大 战 -- FishC Demo") 
background = pygame. image. load(" images/background. png" ) . convert( ) 
# 载 人 游戏 音乐 

pygame. mixer. music. load("sound/game music. ogg") 
pygame.mixer.music.set volume(0.2) 

bullet sound = pygame. mixer. Sound("sound/bullet. wav" ) 

bullet sound.set volume(0.2) 

bomb sound = pygame.mixer.Sound("sound/use bomb. wav") 

bomb sound.set volume(0.2) 

supply sound = pygame. mixer. Sound(" sound/supply. wav" ) 

supply sound.set volume(0.2) 

get bomb sound - pygame.mixer. Sound("sound/get bomb. wav") 

get bomb sound.set volume(0.2) 

get bullet sound = pygame.mixer.Sound("sound/get bullet. wav") 
get bullet sound.set volume(0.2) 

upgrade sound = pygame. mixer. Sound("sound/upgrade. wav" ) 

upgrade sound.set volume(0.2) 

enemy3 fly sound = pygame. mixer. Sound("sound/enemy3 flying. wav") 
enemy3 fly sound.set volume(0.2) 

enemyl down sound - pygame.mixer.Sound("sound/enemyl down. wav") 
enemyl down sound.set volume(0.1) 

enemy2 down sound = pygame.mixer.Sound("sound/enemy2 down. wav") 
enemy2 down sound.set volume(0.2) 

enemy3 down sound = pygame.mixer.Sound("sound/enemy3 down. wav") 
enemy3 down sound.set volume(0.5) 

me down sound - pygame.mixer.Sound("sound/me down. wav") 

me down sound. set volume(0.2) 


def main(): 
pygame. mixer. music. play( - 1) 
clock = pygame. time. Clock() 
running - True 


while running: 
for event in pygame. event.get(): 
if event. type == QUIT: 

pygane. quit() 
sys.exit() 

screen.blit(background, (0, 0)) 

pygame. display. flip() 

clock. tick(60) 


main() 
except SystemExit: 
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pass 


except: 


16.13.3 -我 方 飞机 


接 下 来 应 该 让 主角 登场 ,创建 一 个 myplane. py 模块 来 定义 我 方 飞 机 : 


traceback.print exc() 


pygane. quit() 
input() 


# myplane.py 
import pygame 


class MyPlane( pygame. sprite.Sprite): 


def 


. init (self, bg size): 


pygame.sprite.Sprite. init (self) 

self. image = \ pygame. image. load(" images/mel.png").convert alpha() 
self. rect = self.image.get rect() 

self. width, self. height = bg size[0], bg_size[1] 

# 初始 化 位 于 下 方 的 中 间 位 置 

# 下 方 预 留 60 像素 左右 的 位 置 作 为 "状态 栏 " 

self. rect. left, self. rect.top = (self.width - \ self. rect. width) \ 
// 2, self.height - self. rect. height - 60 

self.speed - 10 


分 别 定 义 moveUpO ,moveDown OO ,moveLeftO fll moveRightO f ARI &BL E. F., Æ., 


右 移 动 : 


def moveUp(self) : 
if self. rect. top> 0: 


self. rect.top -= self. speed 


else: 


self. rect.top = 0 


def moveDown( self): 
if self.rect.bottom « self.height - 60: 


self.rect.top += self.speed 


else: 


self.rect.bottom = self.height - 60 


def moveLeft(self): 
if self. rect. left > 0: 


self. rect. left -= self. speed 


else: 


self. rect. left = 0 


def moveRight( self): 
if self. rect. right < self. width: 


self. rect. left += self. speed 


else: 


self. rect. right = self.width 


16.13.4 响应 键盘 


接着 需要 在 main 模块 中 啊 应 用 户 的 键盘 操作 。 啊 应 用 户 的 键盘 操作 有 两 种 方法 : 第 一 
种 是 通过 KEYDOWN 或 KEYUP 事件 得 知 用 户 是 否 按 下 键盘 按键 ; 第 二 种 是 调用 key 模块 
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的 get_pressed() 方 法 , 它 会 返回 一 个 序列 ,包含 当前 键盘 上 所 有 按键 的 状态 。 

对 于 检测 偶尔 触发 的 键盘 事件 ,推荐 使 用 第 一 种 方法 。 但 对 于 频繁 触发 的 键盘 事件 ,建议 
使 用 第 二 种 方法 。 由 于 整个 游戏 就 是 通过 键盘 来 控制 我 方 飞机 ,所 以 毅然 决然 选用 第 二 种 
方法 : 


# 检测 用 户 的 键盘 操作 

key pressed = pygame.key.get pressed() 

# 移动 我 方 飞机 

if key pressed[K w] or key pressed[K UP]: 
me. moveUp( ) 

if key pressed[K s] or key pressed[K DOWN]: 
me. moveDown( ) 

if key pressed[K a] or key pressed[K LEFT]: 
me. moveLeft( ) 

if key pressed[K d] or key pressed[K RIGHT]: 
me. moveRight( ) 

screen.blit(background, (0, 0)) 

# 绘制 我 方 飞 机 


screen.blit(me. image, me.rect) 


16.13.5 KITAR 


为 了 增加 我 方 飞机 的 动态 效果 ,可 以 通过 下 边 两 张 图 片 的 不 断 切换 来 实现 飞机 “ 突 突 突 ” 
的 飞行 效果 : 


# myplane.py 
class MyPlane( pygame. sprite.Sprite): 
def init (self, bg size): 
pygame.sprite.Sprite. init (self) 
self. imagel = pygame. image. load(" images/mel.png").convert alpha() 
self. image2 = pygame. image. load("images/me2. png"). convert alpha() 
self.rect = self.imagel.get rect() 


# main. py 
switch_image = True 
while running: 
switch_image = not switch_image 
# 绘制 我 方 飞机 
if switch image: 
screen. blit(me. imagel, me. rect) 


else: 


screen. blit(me. image2, me. rect) 


但 实现 起 来 效果 并 不 理想 ,因为 切换 的 速度 太 快 了 …… 所 以 必须 想 办 法 在 不 影响 游戏 正 
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常 运 行 的 条 件 下 增加 点 “延迟 ” 才 行 。 这 里 可 以 使 用 单片机 开发 中 很 常用 的 一 招 一 一 设置 延 时 
变量 : 
# main.py 


delay = 100 
while running: 


# 切换 图 片 
if not(delay % 5): 
switch image = not switch image 
delay -= 1 
if not delay: 
delay = 100 


现在 我 方 飞机 的 画面 就 是 5 帧 切换 一 次 ,如 果 限 定 帧 率 为 60, 则 一 秒 钟 最 多 切换 12 次 。 
16.13.6 KH KHNL 


既然 英雄 已 经 有 了 AAE ME m AE A HR. BILDAD PREIAR T, EN 
的 速度 依次 是 快 .中 、 慢 ,在 游戏 界面 的 上 方位 置 创造 位 置 随机 的 敌 机 ,可 以 让 它们 不 在 同一 排 
出 现 。 将 敌 机 的 定义 写 在 enemy. py 模块 中 : 


# enemy. py 
import pygame 
from random import * 


class SmallEnemy( pygame. sprite. Sprite) : 
def | init (self, bg size): 
pygame.sprite.Sprite. init (self) 


self. image = \ 
pygame. image. load(" images/enemyl1.png").convert alpha() 
self.rect - self.image.get rect() 
self.width, self.height = bg size[0], bg size[1] 
self.speed - 2 
self. rect. left, self. rect. bottom = V 
randint(0, self.width — self. rect. width), \ 
randint( -5 * self. height, 0) 


由 于 敌 机 只 会 一 个 劲 儿 地 往 前 冲 , 所 以 敌 机 的 移动 只 是 简单 地 增加 rect. top 的 值 , 当 敌 机 
的 坐标 超出 屏幕 底 端 , 则 修改 rect. top 的 位 置 , 让 它 重 新 出 现在 屏幕 上 方 的 随机 位 置 : 


def move( self): 
if self.rect. top < self.height: 
self.rect.top += self.speed 
else: 
self.reset() 
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def reset(self): 
self. rect. left, self. rect. bottom = V 
randint(0, self.width - self. rect. width), V 
randint( -5 * self. height, 0) 


这 是 小 型 敌 机 ,同样 的 方法 可 以 定义 出 中 大 型 敌 机 。 其 中 大 型 敌 机 作为 BOSS 级 别 的 存 
在 , 它 的 飞行 也 是 有 特写 和 音效 的 。 另 外 对 比 起 小 型 敌 机 的 普遍 存在 ,中 ,大 型 敌 机 显得 会 更 
少 一 些 , 因 此 将 生成 的 随机 位 置 扩 大 范围 : 


class MidEnemy( pygame. sprite. Sprite): 
def __init__(self, bg size): 


self. speed = 1 

self. rect. left, self. rect. bottom = V 
randint(0, self.width — self. rect. width), V 
randint( -10 * self. height, - self. height) 


class BigEnemy( pygame. sprite. Sprite) : 
def | init (self, bg size): 


self.imagel = V 
pygame. image. load(" images/enemy3 n1.png").convert alpha() 
self. image2 = V 
pygame. image. load(" images/enemy3 n2.png").convert alpha() 


self.speed - 1 

self. rect. left, self. rect. bottom = V 
randint(0, self.width - self. rect. width), V 
randint( 一 15 * self.height, -5 * self. height) 


敌 机 的 定义 有 了 , 接 下 来 就 是 要 在 main 模块 中 实例 化 出 来 : 
# main. py 
def main(): 


enemies = pygame. sprite. Group() 


# 生成 敌 方 小 型 飞机 

small enemies = pygame. sprite. Group() 

add small enemies(small enemies, enemies, 15) 
# 生成 敌 方 中 型 飞机 

mid enemies = pygame. sprite. Group( ) 

add mid enemies(mid enemies, enemies, 4) 

# 生成 敌 方 大 型 飞机 

big enemies = pygame. sprite.Group() 

add big enemies(big enemies, enemies, 2) 


16.13.7 - 提升 敌 机 速度 
随 着 分 数 越 来 越 高 ,游戏 难度 会 逐渐 提升 。 难 度 的 提升 主要 表现 在 敌 机 数量 的 增加 和 速 
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度 的 加 快 。 所 以 将 添加 敌 机 写成 一 个 函数 ,方便 以 后 调用 : 
# main. py 


def add small enemies(groupl, group2, num): 
for i in range(num): 
el = enemy.SmallEnemy(bg size) 
groupl.add(el) 
group2. add( el) 


def add mid enemies(groupl, group2, num): 
for i in range(num): 
e2 - enemy.MidEnemy(bg size) 
groupl. add(e2) 
group2. add( e2) 


def add big enemies(groupl, group2, num): 
for i in range(num): 
e3 - enemy.BigEnemy(bg size) 
groupl. add(e3) 
group2. add( e3) 


让 敌 机 在 界面 上 飞 一 会 儿 : 
# main. py 


def main(): 


H 绘制 大 型 敌 机 
for each in big enemies: 
each. move( ) 
if switch image: 
screen.blit(each. imagel, each. rect) 
else: 
screen.blit(each. image2, each. rect) 
# 即将 出 现在 画面 中 ,播放 音效 
if each. rect. bottom > 一 50: 
enemy3 fly sound. play() 
# 绘制 中 型 敌 机 
for each in mid enemies: 
each. move( ) 
screen.blit(each. image, each. rect) 
# 绘制 小 型 敌 机 
for each in small enemies: 
each. move( ) 
screen. blit(each. image, each. rect) 


16.13.8 m f& ka M 
当 敌 我 两 机 发 生 碰 撞 的 时 候 ,双方 应 该 是 玉石 俱 焚 的 。 现 在 为 每 个 类 添加 撞 
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机 发 生 时 的 惨烈 画面 : 


# myplane.py 
class MyPlane( pygame. sprite.Sprite): 


def 


_ init (self, bg size): 


self.destroy images - [] 
self.destroy images. extend([\ 


pygame. image. load("images/me destroy 1.png").convert alpha()," 


pygame. image. load("images/me destroy 2.png").convert alpha(),VN 


pygame. image. load("images/me destroy 3.png").convert alpha(),V 


pygame. image. load("images/me destroy 4.png").convert alpha() V 


]) 


# enemy. py 
class SmallEnemy( pygame. sprite. Sprite) : 


def _ 


_init__(self, bg_size): 


self.destroy images = [] 
self.destroy images. extend([\ 


pygame. image. load(" images/enemyl downl.png").convert alpha()," 


pygame. image. load("images/enemy1l down2.png").convert alpha(),VN 


pygame. image. load(" images/enemyl down3.png").convert alpha(),"^ 


pygame. image. load("images/enemy1l down4.png").convert alpha() V 


]) 


class MidEnemy( pygame. sprite.Sprite): 


def 


pygame. 
pygame. 
pygame. 
pygame. 


| init (self, bg size): 


self.destroy images = [] 
self.destroy images. extend( [ \ 
image. load("images/enemy2 downl.png").convert alpha(),V 
image. load("images/enemy2 down2.png").convert alpha(), 
image. load("images/enemy2 down3.png").convert alpha()," 
image. load("images/enemy2 down4. png").convert alpha() \ 
]) 


class BigEnemy( pygame. sprite. Sprite): 
def | init (self, bg size): 


self.destroy images - [] 

self.destroy images. extend([\ 

pygame. image. load(" images/enemy3 downl.png").convert alpha(),VN 
pygame. image. load(" images/enemy3 down2.png").convert alpha(),N 
pygame. image. load(" images/enemy3 down3.png").convert alpha(),N 
pygame. image. load(" images/enemy3 down4.png").convert alpha(),V 
pygame. image. load(" images/enemy3 down5.png").convert alpha(),"^ 
pygame. image. load(" images/enemy3 down6.png").convert alpha() \ 

]) 
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然后 为 每 个 类 添加 一 个 active 属性 , 当 该 属性 为 True 表示 飞机 正常 飞行 ,否则 表示 已 经 
遇难 ,显示 毁灭 图 片 ， 


# main. py 
def main(): 


# 中 弹 图 片 索 引 


el destroy index = 
e2 destroy index - 
e3 destroy index - 


oO O O O 


me_destroy_index = 
while running: 


# 绘制 大 型 敌 机 
for each in big enemies: 
if each. active: 
each. move( ) 
if switch image: 
screen.blit(each. imagel, each. rect) 
else: 
screen. blit(each. image2, each. rect) 
# 即将 出 现在 画面 中 ,播放 音效 
if each. rect. bottom > 一 50: 
enemy3 fly sound. play() 
else: 
# BK 
enemy3_down_sound. play() 
if not(delay % 3): 
screen. blit(each. destroy_images[e3_destroy_index], \ 
each. rect) 
e3_destroy_index = (e3_destroy_index + 1) % 6 
if e3_destroy_index == 
each. reset( ) 
# 绘制 中 型 敌 机 : 
for each in mid enemies: 
if each. active: 
each. move( ) 
screen. blit(each. image, each. rect) 
else: 
# BK 
enemy2_down_sound. play() 
if not(delay % 3): 
screen. blit(each. destroy_images[e2_destroy_index], \ 
each. rect) 
e2_destroy_index = (e2_destroy_index + 1) % 4 
if e2_destroy_index == 
each. reset( ) 
# 绘制 小 型 敌 机 : 
for each in small enemies: 
if each. active: 
each. move( ) 
screen. blit(each. image, each. rect) 
else: 


# SK 
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enemyl down sound. play() 
if not(delay % 3): 
screen.blit(each.destroy images[el destroy index],^ 


each. rect) 
el destroy index = (el destroy index + 1) % 4 
if el destroy index == 0: 


each. reset( ) 


# 绘制 我 方 飞机 
if me. active: 
if switch image: 
screen. blit(me. imagel, me. rect) 
else: 
screen. blit(me. image2, me. rect) 
else: 


# BRK 
me down sound. play() 
if not(delay % 3): 
screen.blit(me.destroy images[me destroy index], me. rect) 
me destroy index = (me destroy index + 1) % 4 
if me destroy index == O0: 
print("Game Over!") 
running = False 


下 面 写 碰撞 检测 代码 ,一 旦 我 方 飞机 碰撞 到 敌 机 ,导致 的 结果 就 是 敌我 双方 同归于尽 : 


while running: 


# 检测 我 方 飞机 是 否 被 撞 
enemies down = pygame. sprite. spritecollide(me, enemies, False) 
if enemies down: 
me.active = False 
for e in enemies down: 
e.active - False 


16.13.9 Z EE fili 188 y UI 


由 于 前 边 只 是 使 用 普通 的 spritecollide() 函 数 进行 碰撞 检测 ,所 以 默认 是 以 图 片 的 矩形 区 
域 作 为 检测 范围 ,因此 看 到 的 是 两 飞机 并 没有 真正 相 撞 就 都 毁 了 ,如 图 16-42 所 示 。 

其 实 Pygame 是 可 以 做 到 完美 碰撞 检测 的 。sprite 模块 中 有 个 collide mask O A 7 nJ EJ 
利用 ,该 了 滑 数 要 求 检测 的 对 象 拥 有 一 个 叫 作 mask 的 属性 ,用 于 指定 检测 的 范围 。 关 于 mask. 
Pygame 还 专门 整 了 个 mask 模块 ,其 中 的 from. surface O PR f nf DUE — A Surface 对 象 中 的 
非 透 明 部 分 标志 位 mask 并 返回 。 

依 葫 户 画 焉 ,在 敌 机 和 我 方 飞机 的 类 定义 中 加 入 : 


self.mask = pygame.mask.from surface(self. image) 


然后 将 检测 碰撞 的 函数 改 为 ; 


enemies down = pygame. sprite. spritecollide(me, enemies, False, pygame. sprite. collide mask) 
这 就 实现 了 完美 碰撞 检测 ,如 图 16-43 所 示 。 
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图 16-42 不 完美 碰撞 检测 图 16-43 ”完美 碰撞 检测 


7416.13.10 ”一 个 BUG 


细心 的 读者 朋友 应 该 不 难 发 现 ,刚才 的 代码 其 实 有 一 个 明显 的 BUG, 导 致 部 分 音效 无 法 
正常 播放 。 不 继续 往 下 看 ,你 能 自己 找 出 来 吗 ? 


无 论 是 敌 机 还 是 我 方 飞机 , 当 它 们 毁灭 的 时 候 ,播放 音效 的 代码 是 这 么 被 执行 的 : 


if each. active: 


else: 

# 毁灭 

H 播放 飞机 毁灭 音效 
if not(delay % 3): 


这 样 写 有 什么 问题 吗 ? 当然 有 ! 你 看 ,一 个 飞机 毁灭 只 需要 播放 一 次 音效 ,但 飞机 毁灭 的 
画面 并 不 止 一 帧 ,导致 重复 地 播放 多 次 同一 个 毁灭 的 音效 ,同时 占用 了 很 多 播放 音效 的 通道 ， 
而 Pygame 默认 却 只 有 八条 通道 。 可 想 而 知 , 当 很 多 音效 同时 需要 播放 时 ,后 边 的 音效 就 没有 
空闲 的 通道 可 以 播放 了 。 

所 以 解决 方案 就 是 让 每 个 音效 只 播放 一 次 : 


while running: 
# 绘制 大 型 敌 机 


for each in big enemies: 
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if each. active: 
each. move( ) 
if switch image: 
screen. blit(each. imagel, each. rect) 
else: 
screen. blit(each. image2, each. rect) 
# 即将 出 现在 画面 中 ,播放 音效 
if each. rect. bottom == 一 50: 
enemy3_fly_sound. play( - 1) 
else: 
# 毁灭 
if not(delay % 3): 
if e3 destroy index == 
enemy3 down sound. play() 
screen.blit(each.destroy images[e3 destroy index], 
each. rect) 
e3 destroy index = (e3 destroy index + 1) % 6 
if e3 destroy index -- 0: 
enemy3 fly sound. stop() 
each. reset() 


PET ep 
现在 的 情况 是 我 方 飞机 处 于 落后 挨打 的 状态 KORRI Jr DRE VL GEL AC 8 3t [a] se D, 
行 反击 ! 接 下 来 定义 子弹 ,子弹 分 为 两 种 : 一 种 是 普通 子弹 一 一 一 次 只 发 射 一 颗 ; 另 一 种 是 
补给 发 放 的 超级 子弹 一 一 一 次 可 以 发 射 两 颗 。 
如 图 16-44 和 图 16-45 所 示 。 
& 飞机 大 战 - FishC Demo — C BE 
ocore : a003 


& 飞机 大 战 - FishC Demo — O 
ocore : Q/000 


16-44 ”发 射 普通 子弹 16-45 ”发 射 超级 子弹 
。331 。 


«|| 零 基础 入 门 学 习 Python | 


子弹 的 运动 路 径 是 直线 加 上 ,速度 需要 略 快 于 飞机 的 速度 ( 比 飞 机 速度 还 慢 的 子弹 总 好 像 
有 哪里 不 对 劲 ) 。 子 弹 移 动 到 屏幕 的 尽头 或 击 中 敌 机 则 重新 绘制 ,因此 为 它 添加 一 个 active 属 
性 ,通过 该 属性 判断 子弹 是 否 需要 重新 绘制 。 子 弹 也 单独 定义 为 一 个 模块 : 


# bullet. py 
import pygame 


class Bullet1 (pygame. sprite. Sprite): 
def init (self, position): 

pygame. sprite. Sprite. init (self) 
self. image = pygame. image. load(" images/bullet1. png" ).convert_alpha() 
self. rect = self. image. get_rect() 
self. rect. left, self. rect.top = position 
self. speed = 12 
self. active = True 
self. mask = pygame. mask. from surface(self. image) 


def move( self): 
self. rect.top -= self. speed 
if self. rect. top < 0: 
self.active = False 


def reset(self): 
self.rect.left, self.rect.top - position 
self.active - True 


在 main 模块 中 生成 子弹 : 
# main. py 
def main(): 


# 生成 子弹 

bulletl = [] 

bulletl index = 0 

BULLET1 NUM = 4 

for i in range(BULLET1 NUM): 
bulletl.append(bullet.Bulletl(me.rect.midtop)) 


设置 每 I0 帧 发 射 一 颗 子弹 : 


while running: 
# 发 射 子弹 ,每 隔 10 帧 射出 一 发 
if not(delay % 10): 
bulletl[bulletl index].reset(me.rect.midtop) 
bulletl index = (bulletl index + 1) % BULLET1 NUM 


接着 需要 检测 每 箱子 弹 是 否 击 中 敌 机 ,并 根据 active 属性 判断 是 否 绘制 子弹 到 屏幕 上 : 
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# 检测 子弹 是 否 击 中 敌 机 
for b in bulletl: 
if b.active: 
b. move( ) 
Screen. blit(b. image, b.rect) 
enemy hit = pygame. sprite. spritecollide(V 
b, enemies, False, pygame.sprite.collide mask) 
if enemy hit: 
b.active - False 
for e in enemy hit: 
e.active - False 


程序 实现 如 图 16-46 所 示 。 
& 飞机 大 战 -- FishC Demo 一 O 


16-46 发射 子 弹 


16.13.12 RERI ME” 
敌 机 也 不 能 太 脆 弱 , 对 于 中 型 和 大 型 敌 机 ,应 该 给 它 添 加 一 个 energy 属性 : 


# enemy. py 
class MidEnemy( pygame. sprite. Sprite): 
energy = 8 
def __init__(self, bg_size): 
self. energy = MidEnemy. energy 


def reset(self): 
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self. energy = MidEnemy. energy 


class BigEnemy(pygame. sprite.Sprite): 
energy - 20 


def init (self, bg size): 


self.energy 


BigEnemy. energy 


def reset(self): 


self.energy 


BigEnemy. energy 


每 当中 、 大 型 敌 机 被 子弹 击 中 , 先 将 energy 属性 的 值 减 1, 直 到 energy 的 值 为 0 才 让 该 敌 
机 毁灭 ; 


# main. py 


for b in bullet1: 
if b. active: 


b. move( ) 


screen. blit(b. image, b. rect) 
enemy_hit = 


pygame. sprite. spritecollide(\ 


b, enemies, False, pygame. sprite. collide mask) 
if enemy_hit: 


b.active = False 


for e in enemy hit: 


if e in mid enemies or e in big enemies 


e. energy -= 1 
if e. ener == 
e.active = False 
else: 
e.active = False 
uf H P KRKE KAL n — Ar A dz D Be o FE n] LA E A e LE B6 Z8 LE E F 
多 少 生命 : 
# main.py 
# 绘制 血 槽 


pygame. draw. line( screen, BLACK, V 


(each. rect. left, each. rect. top - 5), \ 
(each. rect. right, each. rect.top - 5), \ 
2) 


* 生命 大 于 20% 显示 绿色 ,否则 显示 红色 


energy remain - 


- each.energy / enemy. BigEnemy. energy 
if energy remain > 0.2: 


energy color - GREEN 
else: 


energy color 


RED 
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pygame. draw.line(screen, energy color, \ 
(each. rect. left, each. rect. top - 5), V 
(each. rect. left + each.rect.width * energy remain, V 


each.rect.top - 5), 2) 


16.13.13 中 弹 效果 


当中 、 大 型 敌 机 被 子弹 击 中 但 并 不 至 于 毁灭 的 时 候 , 应 该 是 有 “特效 ”的 。 先 在 enemy. py 
模块 为 MidEnemy 和 BigEnemy 类 添加 image hit 属性 ,用 于 存放 敌 机 被 击 中 的 图 片 。 还 需要 


一 个 hit 属性 ,用 于 判断 是 否 被 子弹 击 中 。 


# enemy. py 
class MidEnemy( pygame. sprite. Sprite): 
def | init (self, bg size): 


self. image hit = pygame. image. load("images/enemy2 hit.png").convert alpha() 
self.hit - False 


class BigEnemy( pygame. sprite. Sprite): 
def | init (self, bg size): 


self. image hit = pygame. image. load(\ 
"images/enemy3 hit.png").convert alpha() 
self.hit - False 


在 检测 到 子弹 击 中 敌 机 时 将 对 应 的 hit 属性 改 为 True, 最 后 绘制 敌 机 时 先 检 测 hit 属性 ， 
如 果 为 True 则 绘制 被 击 中 的 图 片 : 


# 绘制 大 型 敌 机 
for each in big enemies: 
if each. active: 


if each. hit: 
screen.blit(each. image hit, each. rect) 
each.hit = False 
else: 
if switch image: 
screen. blit(each. imagel, each. rect) 


else: 
screen. blit(each. image2, each. rect) 


# 绘制 中 型 敌 机 : 
for each in mid enemies: 
if each. active: 


if each. hit: 
screen. blit(each. image hit, each. rect) 
each.hit - False 
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else: 
screen.blit(each. image, each. rect) 


46.13.14 ”绘制 得 分 ier 
E | s 
DERA f c E fü wr b zs Do CIT 43-4 2f Sic SE GE i P] PLC CELA [e] ep 
别 可 以 获得 1000 47,6000 分 和 10000 分 。 有 些 读者 朋友 可 能 会 觉得 1000 分 作为 基本 单位 显 


得 有 点 浮夸 ,不 过 这 完全 是 游戏 开发 的 业界 习惯 。 
增加 一 个 score 变量 用 于 记录 玩家 得 分 , 当 敌 机 被 消灭 的 时 候 , 加 上 对 应 的 分 数 : 


def main(): 


score - 0 
score font = pygame.font.Font("font/font. TTF", 36) 


while running: 


£X. MAILEK, score 分 别 增 加 10000,6000 和 1000 分 


# 绘制 得 分 

Score text = score font. render(\ 
"Score : % s" % str(score), True, WHITE) 
screen.blit(score text, (10, 5)) 


程序 实现 如 图 16-47 所 示 , 
& 飞机 大 战 -- FishC Demo 一 C 


core : 10000 


16-47 ”绘制 得 分 
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16.13.15 暂停 游戏 
右上 角 可 以 添加 一 个 暂停 按钮 ,让 玩家 随时 可 以 把 游戏 暂停 下 来 。 暂 停 按 钮 总 共有 四 种 


样式 ,如 图 16-48 所 示 。 

这 些 按钮 分 别 代表 继续 游戏 和 和 暂停 游戏 的 命令 ， [> » aH aa 
其 中 深 色 的 图 标 表 示 鼠 标 停留 在 按钮 上 方 时 显示 的 样 
式 。 通 过 响应 MOUSEBUTTONDOWN 事件 并 判断 图 16-48 暂停 按钮 
鼠标 的 位 置 可 以 得 知 玩家 是 否 按 下 了 暂停 按钮 ,通过 啊 应 MOUSEMOTION 事件 修改 暂停 按 


# main. py 


def main(): 


# 是 否 暂 停 游戏 

paused = False 

pause nor image = V 

pygame. image. load("images/pause nor.png").convert alpha() 
pause pressed image = V 

pygame. image. load("images/pause pressed. png").convert alpha() 
resume nor image = V 

pygame. image. load("images/resume nor.png").convert alpha() 
resume pressed image = V 

pygame. image. load("images/resume pressed. png").convert alpha() 
paused rect = pause nor image.get rect() 

paused rect.left, paused rect.top = V 

width - paused rect.width - 10, 10 

# 默认 显示 这 个 


paused image = pause nor image 


while running: 
for event in pygame. event. get( ) : 


elif event.type -- MOUSEBUTTONDOWN: 
if event. button == 1 and \ 
paused rect.collidepoint(event. pos): 
paused = not paused 
elif event.type -- MOUSEMOTION: 
if paused rect.collidepoint(event. pos): 
if paused: 
paused image - resume pressed image 
else: 
paused image - pause pressed image 
else: 
if paused: 


paused image - resume nor image 
else: 


paused image - pause nor image 
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接着 让 游戏 的 主流 程 只 有 在 paused 为 False 的 时 候 才 得 以 执行 ,另外 还 需要 将 screen. 
blit(background,，(0, 0)) 提 取出 来 ,这 样 玩家 就 没 办 法 通过 不 断 地 暂停 \、 继 续 游 戏 来 实现 “ 作 
H” AJITH. 

# main. py 


while running: 
# 事件 循环 
screen. blit(background, (0, 0)) 
if not paused: 
# 游戏 主流 程 
# 绘制 暂停 按钮 
screen.blit(paused image, paused rect) 


16.13.16 控制 难度 


敌人 的 速度 如 有 果 一 成 不 变 ( 一 直 维 持 慢 悠 修 的 移动 ), 那 么 对 于 玩家 来 说 是 无 法 接受 的 。 
因为 玩家 希望 得 到 的 游戏 体验 是 刺激 ,是 心跳 ! 所 以 要 让 游戏 的 难度 随 着 得 分 的 增加 而 增加 。 
这 里 将 游戏 划分 为 5 个 级 别 ,每 提升 一 个 级 别 ,就 增加 一 些 敌 机 ,或 提高 敌 机 的 移动 速度 。 


def inc speed(target, inc): 
for each in target: 
each. speed += inc 


def main(): 
# 设置 难度 级 别 
level = 1 


while running: 


# 根据 用 户 分 数 增加 难度 
if level == 1 and score > 50000: 
level = 2 
upgrade sound. play() 
# 增加 3 架 小 型 敌 机 、2 架 中 型 敌 机 和 1 架 大 型 敌 机 
add small enemies(small enemies, enemies, 3) 
add mid enemies(mid enemies, enemies, 2) 
add big enemies(big enemies, enemies, 1) 
# 提升 小 型 敌 机 的 速度 
inc speed(small enemies, 1) 
elif level -- 2 and score » 300000: 
level = 3 
upgrade sound. play() 
# 增加 5 架 小 型 敌 机 、3 架 中 型 敌 机 和 2 架 大 型 敌 机 
add small enemies(small enemies, enemies, 5) 
add mid enemies(mid enemies, enemies, 3) 


add big enemies(big enemies, enemies, 2) 
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# 提升 小 .中 型 敌 机 的 速度 


inc speed(small enemies, 1) 
inc speed(mid enemies, 1) 
elif level == 3 and score > 600000: 
level = 4 
upgrade sound. play() 
# 增加 5 架 小 型 敌 机 、3 架 中 型 敌 机 和 2 架 大 型 敌 机 
add small enemies(small enemies, enemies, 5) 
add mid enemies(mid enemies, enemies, 3) 
add big enemies(big enemies, enemies, 2) 
# 提升 小 .中 型 敌 机 的 速度 
inc speed(small enemies, 1) 
inc speed(mid enemies, 1) 
elif level == 4 and score > 1000000: 
level = 5 
upgrade sound. play() 
# 增加 5 架 小 型 敌 机 、3 架 中 型 敌 机 和 2 架 大 型 敌 机 
add small enemies(small enemies, enemies, 5) 
add mid enemies(mid enemies, enemies, 3) 
add big enemies(big enemies, enemies, 2) 
# 提升 小 .中 型 敌 机 的 速度 
inc speed(small enemies, 1) 
inc speed(mid enemies, 1) 


16.13.17 全 屏 炸 弹 


其 实 只 要 到 了 level5 的 时 候 , 就 会 下 飞机 雨 , 这 时 玩家 就 很 容易 陷 人 不 利 的 局 面 。 因 此 ， 
游戏 为 玩家 提供 了 全 屏 炸 弹 这 一 超级 杀 招 。 此 招 一 出 ,界面 上 所 有 的 敌 机 将 会 在 一 瞬间 灰 飞 
烟 灭 ,让 玩家 谈 笑 于 千里 之 外 。 

通过 空格 键 可 以 触发 全 屏 炸 弹 ,初始 情况 下 有 三 里 全 屏 炸 弹 , 可 以 通过 补给 获得 ,但 最 多 
只 能 闻 载 三 颗 。 由 于 触发 全 屏 炸 弹 是 属于 偶然 的 操作 ,因此 通过 啊 应 KEYDOWN 事件 再 检 
WH F event. key 是 否 为 KR_SPACE 即 可 ; 


def main(): 


# 全 屏 炸弹 

bomb image = pygame. image. load(" images/bomb. png" ) . convert alpha() 
bomb rect = bomb image.get rect() 

bomb font = pygame. font. Font("font/font. ttf", 48) 

bomb num = 3 


while running: 
for event in pygame. event. get() : 


elif event.type -- KEYDOWN: 
if event.key -- K SPACE: 
if bomb num: 
bomb num -= 1 
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bomb sound. play() 
for each in enemies: 
if each. rect. bottom » 0: 
each.active - False 


# 绘制 全 屏 炸弹 数量 
bomb text = bomb font.render(" X $& d" % bomb num, True, WHITE) 


text rect - bomb text.get rect() 
screen.blit(bomb image, (10, height - 10 - bomb rect. height)) 
screen.blit(bomb text, V 

(20 + bomb rect.width, height - 5 - text rect.height)) 


16.13.18 发 放 补 给 包 


游戏 设计 每 30 秒 随机 发 放 一 个 补给 包 ,可 能 是 超级 子弹 ,也 可 能 是 全 屏 炸 弹 。 生 时 
补给 包 有 自己 的 图 像 和 运动 轨迹 ,不 妨 单独 为 其 定义 一 个 模块 : 


* supply.py 
import pygame 
from random import * 


class Bullet Supply(pygame. sprite. Sprite): 
def init (self, bg size): 

pygame. sprite. Sprite. init (self) 
self. image = pygame. image. load( V 
"images/bullet supply.png").convert alpha() 
self. rect = self.image.get rect() 
self. width, self. height = bg size[0], bg size[1] 
self. rect. left, self. rect. bottom = randint( 
0, self. width - self.rect.width), - 100 
self. speed = 5 
self. active = False 
self. mask = pygame.mask.from surface(self. image) 


def move( self): 
if self. rect. top < self. height: 
self. rect.top += self. speed 
else: 
self.active = False 


def reset(self): 
self.active - True 
self. rect. left, self. rect. bottom = randint(\ 
0, self. width - self.rect.width), - 100 


class Bomb Supply(pygame. sprite. Sprite): 
def | init (self, bg size): 
pygame.sprite.Sprite. init (self) 
self. image = pygame. image. load("images/bomb supply. png") 
self.rect - self.image.get rect() 
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self.width, self.height = bg size[0], bg size[1] 
self. rect. left, self. rect. bottom = randint(\ 

0, self. width - self.rect.width), - 100 

self. speed = 5 

self.active = False 


self. mask = pygame.mask.from surface(self. image) 


def move( self): 
if self. rect. top < self. height: 
self. rect. top += self. speed 
else: 
self.active = False 


def reset(self): 
self. rect. left, self. rect. bottom = randint(\ 
0, self. width - self.rect.width), - 100 
self. active = True 


在 main 模块 中 实例 化 补给 包 , 并 设置 一 个 补给 包 发 放 定 时 带 , 每 三 十 秒 随机 发 放 一 个 补 
给 包 : 


# main.py 


def main( ) : 


E 每 30 秒 发 一 个 补给 包 

bomb supply = supply. Bomb Supply(bg size) 
bullet supply = supply.Bullet Supply(bg size) 
SUPPLY TIME - USEREVENT 

pygame. time. set timer(SUPPLY TIME, 30 * 1000) 


while running: 
for event in pygame. event. get() : 


elif event.type -- SUPPLY TIME: 
supply sound. play() 
if choice([True, False]): 
bomb supply. reset() 
else: 
bullet supply.reset() 


if not paused: 


H 绘制 全 屏 炸 弹 补 给 并 检测 是 否 获得 
if bomb supply.active: 
bomb supply. move() 
screen.blit(bomb supply. image, bomb supply. rect) 
if pygame. sprite.collide mask(bomb supply, me): 
get bomb sound. play() 
if bomb num « 3: 
bomb num *- 1 
bomb supply.active = False 


# 绘制 超级 子弹 补给 并 检测 是 否 获得 


e 341 。 


«|| 零 基础 入 门 学 习 Python 


if bullet supply.active: 
bullet supply. move() 
screen.blit(bullet supply. image, bullet supply.rect) 
if pygame. sprite.collide mask(bullet supply, me): 
get bullet sound. play() 
# 发 射 超级 子弹 
bullet supply.active = False 


程序 实现 如 图 16-49 所 示 。 
9 飞机 大 战 -- Fishc Demo - 


: a400 


图 16-49 发 放 补 给 包 


接 下 来 有 个 细节 问题 ,就 是 当 用 于 单 击 和 暂停 按钮 的 时 候 , 补 给 计时 需 应 该 暂停 ,否则 每 隔 
一 段 时 间 就 会 听 到 发 放 补 给 的 声音 。 另 外 ,背景 音乐 和 其 他 音效 也 应 该 暂停 ,因为 玩家 既然 单 
击 了 和 暂停 按钮 ,可 能 是 要 接 个 电话 或 者 出 去 打 个 酱油 ,所 以 程序 还 是 安静 地 等 春 就 可 以 了 : 


elif event. type == MOUSEBUTTONDOWN: 
if event. button == 1 and paused rect. collidepoint(event. pos): 

paused = not paused 

# 暂停 时 停止 补给 发 放 和 背景 音乐 

if paused: 
pygame.time.set timer(SUPPLY TIME, 0) 
pygame. mixer. music. pause( ) 
pygame. mixer. pause() 

else: 
pygame.time.set timer(SUPPLY TIME, 30 * 1000) 
pygame. mixer. music. unpause( ) 
pygame. mixer. unpause( ) 
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16.13.19 超级 子弹 


当 接 到 超级 子弹 补给 包 的 时 候 , 子 弹 由 原先 的 一 次 发 射 一 发 变 成 两 发 ,子弹 的 速度 也 相对 
会 快 一 些 。 先 在 bullet 模块 中 添加 Bullet2 类 来 描述 超级 子弹 ; 


# bullet. py 
class Bullet2: 
def init (self, position): 

pygame.sprite.Sprite. init (self) 
self. image = V 
pygame. image. load(" images/bullet2.png").convert alpha() 
self.rect = self.image.get rect() 
self.rect.left, self.rect.top = position 
self.speed - 14 
self.active - True 
self.mask = pygame.mask.from surface(self. image) 


def move(self): 
self. rect.top -= self. speed 
if self. rect. top < 0: 
self.active = False 


def reset(self, position): 
self.rect.left, self.rect.top - position 
self.active - True 


B 2C Y" s Jr p] ICE « Jr VAL PR ql fs FE NER] 7g 18 秒 , 过 了 这 个 时 间 就 自动 变 回 普通 子弹 。 
因此 需要 一 个 超级 子弹 定时 天 ,还 需要 用 一 个 变量 来 表示 子弹 的 发 射 类 型 。 


# main. py 

def main(): 
# 生成 超级 子弹 
bullet2 = [] 


bullet2 index = 0 

BULLET2 NUM = 8 

for i in range(BULLET2 NUM//2): 
bullet2.append(bullet.Bullet2( V 
(me. rect. centerx - 33, me. rect. centery))) 
bullet2.append(bullet.Bullet2( V 
(me. rect. centerx + 30, me. rect. centery))) 


# 超级 子弹 定时 需 

DOUBLE BULLET TIME = USEREVENT + 1 
# 是 否 使 用 超级 子弹 

is double bullet = False 


while running: 
for event in pygame. event. get() : 
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elif event.type == DOUBLE BULLET TIME: 
is double bullet - False 
pygame.time.set timer(DOUBLE BULLET TIME, 0) 


if not paused: 


H 绘制 超级 子弹 补给 并 检测 是 否 获得 
if bullet supply.active: 


bullet supply. move() 

screen.blit(bullet supply. image, bullet supply. rect) 

if pygame. sprite.collide mask(bullet supply, me): 
get bullet sound. play() 
is double bullet - True 
# 超级 子弹 限制 使 用 18 秒 
pygame.time.set timer(DOUBLE BULLET TIME, 18 * 1000) 
bullet supply.active = False 

# 发 射 子弹 
if not(delay % 10): 

if is double bullet: 
bullets - bullet2 
bullets[bullet2 index].reset( \ 
(me. rect. centerx - 33, me. rect.centery)) 
bullets[bullet2 index -* 1].reset( \ 
(me. rect. centerx * 30, me.rect.centery)) 
bullet2 index = (bullet2 index + 2) % BULLET2 NUM 

else: 
bullets = bulletl 
bullets[bulletl1 index].reset(me.rect.midtop) 
bulletl index = (bulletl index + 1) % BULLET1 NUM 

bullet sound. play() 


# 检测 子弹 是 否 击 中 敌 机 
for b in bullets: 


16.13.20 三 次 机 会 


很 多 游戏 都 会 给 玩家 多 次 尝试 的 机 会 ,因此 也 会 添加 这 么 一 个 功能 。 玩 家 总 加 
共 会 有 3 次 机 会 ,游戏 界面 右 下 角 的 小 飞机 代表 还 有 多 少 次 机 会 ,如 图 16-50 所 示 。 
现在 myplane 模块 中 添加 一 个 reset(0) 方 法 ,用 于 重新 诞生 一 个 新 的 飞机 


# myplane.py 


def reset(self): 
self. rect. left, self.rect.top = V 
(self.width — self. rect. width) // 2, \ 
self. height - self.rect.height - 60 
self.active = True 
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16-50 ”提供 多 次 机 会 


接着 修改 main 模块 ,增加 一 个 life num—3 变量 ,在 我 方 飞 机 毁灭 时 life_num 减 1, 并 在 
界面 的 右 下 角 显 示 还 有 和 多少 次 机 会 : 
# main.py 
def main(): 
# 生命 数量 
life image = pygame. image. load(" images/life.png").convert alpha() 


life rect = life image.get rect() 
life num = 3 


while running: 
if life num and not paused: 


# 绘制 我 方 飞机 
if me.active: 
if switch image: 
screen.blit(me. imagel, me.rect) 
else: 
screen.blit(me. image2, me.rect) 


else: 
# BK 
if not(delay % 3): 
if me destroy index == 
me down sound. play() 
screen. blit( V 
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me.destroy images[me destroy index], me.rect) 
me destroy index = (me destroy index + 1) %\4 
if me destroy index -- 

life num -= 1 


me. reset() 


# 绘制 剩余 生命 的 数量 
if life num: 
for i in range(life num): 
screen.blit(life image, \ 
(width- 10- (i*1)*life rect.width, \ 
height - 10- life rect. height) ) 
# 游戏 结束 画面 
elif life num == 0: 
print("Game Over!" ) 


这 里 有 个 小 细节 iu Ie REI; VBLIPUPEJG «UL R TUE AE 15 E A AL. AAS FAR 
方 飞 机 一 诞生 就 牺牲 的 惨剧 。 因 此 可 以 设 定 每 次 牺牲 后 会 有 3 秒 钟 的 安全 期 ,在 安全 期 内 政 
机 是 无 法 伤害 到 你 的 。 

具体 做 法 就 是 在 Myplane 中 加 入 一 个 invincible 属性 ,该 属性 为 True 时 我 方 飞 机 处 于 一 


个 无 敌 状 态 : 
# myplane.py 


class MyPlane( pygame. sprite.Sprite): 
def init (self, bg size): 


self.invincible = False 
def reset(self): 


self.invincible = True 


新 飞机 诞生 时 ,设置 一 个 3 秒 钟 的 定时 硕 : 
# main. py 
" main(): 


# 解除 我 方 无 敌 状 态 
INVINCIBLE TIME = USEREVENT + 2 


while running: 
for event in pygame. event. get( ) : 


elif event.type -- INVINCIBLE TIME: 
me.invincible = False 


pygame.time.set timer(INVINCIBLE TIME, 0) 


if life num and not paused: 
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# 检测 我 方 飞 机 是 否 被 撞 
enemies down = pygame. sprite. spritecollide( V 
me, enemies, False, pygame. sprite.collide mask) 
if enemies down and not me. invincible: 
me.active - False 
for e in enemies down: 
e.active - False 
# 绘制 我 方 飞机 
if me. active: 
if switch image: 
screen. blit(me. imagel, me. rect) 
else: 
screen. blit(me. image2, me. rect) 
else: 
# RK 
if not(delay % 3): 
if me_destroy_index == 
me down sound. play() 
screen.blit(me.destroy images[me destroy index], \ 
me. rect) 
me destroy index = (me destroy index + 1) % 4 
if me destroy index -- 
life num -- 
me. reset() 
pygame.time.set timer(INVINCIBLE TIME, 3 * 1000) 


16.13.21 结束 画面 


M life num 的 值 为 0 时 ,说 明 玩家 已 经 输 掉 了 游戏 ,进入 游戏 结束 画面 ,如 图 16-51 所 示 。 
& 飞机 大 战 - FishC Demo — C BE 
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9756000 


重新 开始 
结束 游戏 


图 16-51 游戏 结束 画面 
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游戏 结束 时 ,结束 画面 会 显示 历史 最 高 得 分 ,以 及 玩家 的 最 终 成 绩 。 如 果 玩家 的 最 终 成 绩 

比 历史 最 高 得 分 要 高 ,那么 将 玩家 成 绩 写 和 存档。 另外 ,结束 画面 有 “重新 开始 "和 “结束 游戏 ” 
两 个 按钮 ， 


# main. py 
def main(): 


# 用 于 阻止 重复 打开 记录 文件 

recorded = False 

# 游戏 结束 画面 

gameover font = pygame.font.Font("font/font. TTF", 48) 

again image = pygame. image. load(" images/again. png"). convert alpha() 
again rect - again image.get rect() 

gameover image = \ 

pygame. image. load(" images/gameover. png").convert alpha() 

gameover rect - gameover image.get rect() 


while running: 
if life num and not paused: 


# 游戏 结束 画面 
elif life num == 0: 
# 背景 音乐 停止 
pygame. mixer. music. stop() 
# 停止 全 部 音效 
pygame. mixer. stop() 


# 停止 补给 发 放 
pygame.time.set timer(SUPPLY TIME, 0) 
if not recorded: 

recorded - True 

# 读 取 历史 最 高 得 分 

with open("record.txt", "r") as f: 

record score - int(f.read()) 
# 如 果 玩 家 得 分 高 于 历史 最 高 得 分 , 则 存档 
if score > record score: 
with open("record. txt", "w") as f: 
f.write(str(score)) 

# 绘制 结束 画面 
record score text = score font.render( \ 
"Best : %d" * record score, True, (255, 255, 255)) 
Sscreen.blit(record score text, (50, 50)) 
gameover textl = gameover font.render( \ 
"Your Score", True, (255, 255, 255)) 
gameover textl rect - gameover textl.get rect() 
gameover textl rect.left, gameover textl rect.top = V 
(width - gameover textl rect.width) // 2, height // 3 
screen.blit(gameover textl, gameover textl rect) 
gameover text2 - gameover font.render( V 
str(score), True, (255, 255, 255)) 
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gameover text2 rect = gameover text2.get rect() 
gameover text2 rect.left, gameover text2 rect.top = \ 
(width — gameover text2 rect.width) // 2,\ 
gameover textl rect.bottom + 10 
Sscreen.blit(gameover text2, gameover text2 rect) 
again rect.left, again rect.top = \ 
(width — again rect.width) // 2, VN 
gameover text2 rect.bottom + 50 
screen.blit(again image, again rect) 
gameover rect.left, gameover rect.top = V 
(width - again rect.width) // 2, \ 
again rect.bottom + 10 
screen.blit(gameover image, gameover rect) 
# 检测 用 户 的 鼠标 操作 
# 如 果 用 户 按 下 鼠标 左 键 
if pygame. mouse. get pressed( )[0]: 

# 获取 鼠标 坐标 

pos = pygame.mouse.get pos() 

# 如 果 用 户 单 击 "重新 开始 " 

if again rect. left < pos[0] < again rect. right \ 

and again rect.top < pos[1] < again rect. bottom: 

# 调用 main 函数 ,重新 开始 游戏 
main() 

# 如 果 用 户 单 击 " 结 束 游戏 " 

elif gameover rect. left < pos[0] < \ 

gameover rect.right and gameover rect. top < pos[1] < \ 

gameover rect.bottom: 


# 退出 游戏 
pygame. quit() 
sys. exit() 
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